《Python文本分析》遵循结构化和综合性的方法,介绍了文本和语言语法、结构和语义的基础概念和高级概念。从自然语言和Python的基础开始,进而学习先进的分析理念和机器学习概念。
全面提供了自然语言处理(NLP)和文本分析的主要概念和技术。包含了丰富的真实案例实现技术,例如构建分类新闻文章的文本分类系统,使用主题建模和文本摘要分析app或游戏评论,进行热门电影概要的聚类分析和电影评论的情感分析。介绍了基于Python和流行NLP开源库和文本分析实用工具,如自然语言工具包nltk、gensim、scikit-learn、spaCy和Pattern。
学习参考:《Python文本分析》中文PDF,285页,文字可以复制。《Python文本分析》英文PDF,397页,文字可以复制。
配套源代码。作者: [印] 迪潘简·撒卡尔
下载: https://pan.baidu.com/s/1s30LJMsOJyk6sdHatqqVOQ 提取码: tyn2
涉及的主要内容有第1章自然语言基础,第2章Python语言,第3章处理和理解文本,第4章文本分类。
第5章文本摘要,第6章文本相似度和聚类,第7章语义与情感分析,包括语义分析、探索WordNet、词义消歧、命名实体识别、分析语义表征、情感分析、IMDb电影评论的情感分析等内容。