Python初学者,目前为止初步学完了基础语法和常用库的操作。“《三国演义》词云”是近期归纳学习心得期间一时兴起做来练手的,水平极其有限,仅作记录。自学Python强推北京理工大学嵩天教授的MOOC:Python语言程序设计;课件的深度设置地很舒服,非常适合零基础入门或者有数据分析需求但是无意深挖技术的听众。以上为背景1. 语料与外部库:三国演义全文txt格式语料:Python123.i
转载
2023-12-09 16:58:16
287阅读
使用python统计《三国演义》小说里人物出现次数前十名,并实现可视化。
python统计三国演义里的人物出场次数
一、安装所需要的第三方库jieba (jieba是优秀的中文分词第三分库)
pyecharts (一个优秀的数据可视化库)《三国演义》.txt下载地址(提取码:kist )使用p
转载
2023-06-26 15:05:56
1074阅读
文章目录效果展示介绍软件架构使用说明导入需要的库执行main.py 这里以三国演义为例 三国演义.txt alice_mask.png效果展示介绍Python读取小说文本,绘制词云图,主要人物出场次序,社交网络关系图,章回字数软件架构环境准备:Python3 主要模块:networkx wordcloud matplotlib pyecharts imageio jieba使用说明导入需要的库
转载
2023-08-07 19:22:19
512阅读
总览前言功能函数与展示获取本地txt文件内容将停用词文件的词读入到列表stopwords中分词并统计词频分词结果词云更换词云形状章回统计统计每一回中玄德出现的次数统计“曹贼”“大耳贼”“美髯公”"汉贼"三国兴衰平均段落数与字数社交网络换一种布局代码获取 前言本项目主要利用python的jieba库对三国演义进行词频分析,并通过WordCloud、networkx,matplotlib等库进行可视
转载
2023-12-17 10:07:40
432阅读
第001回 宴桃园豪杰三结义 斩黄巾英雄首立功 第002回 张翼德怒鞭督邮 何国舅谋诛宦竖 第003回 议温明董卓叱丁原
原创
2022-07-25 10:32:33
1394阅读
嗯,是《三国演义》,不是《三国志》。个人觉得如果不是学者,不一定要探究历史的每个细节,而是要从历史上发生的事情中得到经验,映射到自己或者当今社会中,便会有所感悟,有所收获。 先说汉朝 东汉末年,汉室倾覆。为什么?原因在于东汉的皇帝都很短命,为什么短命?近亲结婚?有的说法是皇后为了想专政,故意废长立幼
原创
2021-11-14 10:46:38
246阅读
# Python三国演义分词
《三国演义》是中国古代四大名著之一,描绘了中国历史上的三国时期的政治斗争、战争与英雄豪杰。在现代社会中,自然语言处理技术的发展使得我们可以利用计算机来对文本进行分析和处理。本文将介绍如何使用Python进行《三国演义》文本的分词处理。
## 什么是分词?
分词是将一段连续的文本切割成一个个有意义的词语的过程。例如,对于句子“我喜欢Python编程”,分词的结果可
原创
2023-07-27 18:50:26
210阅读
1.目标
python爬取三国演义,生成词云、图表
2.码前须知
项目目标:三国人物名称及出现次数-----数据统计分析
提出问题:哪个人物在三国演义中出现的次数最多?,我们希望通过数据分析来获得答案。
分析工具:pandas,Matplotlib
pip install bs4
pip install lxml
pip install pandas
pip install Matplotlib
转载
2024-06-17 03:39:54
349阅读
刚学完英文词频统计,现在我们来看一下中文人物出场统计下面我们以《三国演义》为例,进行统计分析一、解题思路1.jieba库的使用jieba库是优秀的中文第三方库,利用jieba库我们可以对中文文本分词获得单个的词语2.词语筛选本次统计的目的是获取《三国演义》中的人物出场次数,这就要求我们对词语进行筛选,筛除一个字的词语(不可能是人名)通过对输出的结果进行分析,将不符合的词语进行筛除,不断重复该步骤,
转载
2024-01-04 19:58:11
991阅读
上一篇简单回顾了华为手机成立十四年的发展道路,今天继续聊聊这个行业几家热门厂商。首先,手机这个行业确实不太
原创
2021-07-14 10:38:23
101阅读
# 用Python绘制《三国演义》词云图
《三国演义》是中国古代著名的历史小说,描绘了东汉末年到三国时期的众多英雄人物和战争故事。在数据可视化领域,词云(Word Cloud)是一种常用的图形展示方式,它可以直观地显示文本数据中词汇的出现频率。本文将介绍如何使用Python绘制《三国演义》的词云图,并提供相关代码示例。
## 第一部分:环境准备
在开始之前,我们需要确保安装了以下Python
1、网页URL: http://www.shicimingju.com/book/sanguoyanyi.html 1.1 注意安装环境 pip install bs4 pip install lxml(解析器) 1.2 数据解析原理: 1.2.1 标签定位 1.2.2 提取标签、标签属性中存储的数据值 1.3 bs4数据解析的原理:(bs4只能用于python) 1.3.1实例化一个Beauti
上一篇简单回顾了华为手机成立十四年的发展道路,今天继续聊聊这个行业几家热门厂商。首先,手机这个行业确实不太好混。昔日的霸主诺基亚已经彻底消失,如日中天的三星也因为note7的爆炸预计损失高达50亿美金,而国内的手机厂商更是你方唱罢,我登场。本文重点回顾下国内热门厂商,小米,oppo&vivo,华为几家,这几家又恰好有点像手机行业的三国演义。一、小米虽然最近小米难掩衰败的气象,但是雷军在20
原创
2021-03-16 22:19:27
243阅读
1.目标
python爬取三国演义,生成词云、图表
2.码前须知
项目目标:三国人物名称及出现次数-----数据统计分析
提出问题:哪个人物在三国演义中出现的次数最多?,我们希望通过数据分析来获得答案。
分析工具:pandas,Matplotlib
pip install bs4
pip install lxml
pip install pandas
pip install Matplotlib
转载
2023-12-30 20:10:13
113阅读
前面分析统计了金庸名著《倚天屠龙记》中人物按照出现次数并排序然后使用pyecharts,统计B站某视频弹幕内容,并绘制成词云显示 这次,就用分析统计下《三国演义》这部书里各角色出现的频率,并绘制成词云显示,看看谁是绝对的主角吧 首先,我们需要把这部书里出现的人物都枚举出来,毕竟只统计角色信息,不需要把非人物名也统计进来角色 = {'刘备','诸葛亮','关羽','张飞','刘禅
转载
2023-12-08 21:58:12
624阅读
“滚滚长江东逝水,浪花淘尽英雄”。近来读《三国演义》,忽然想看看到底哪位英雄在书中提到的最多,于是就想用分词算法实现一下。 网上也确实有相关的案例,作为参考,自己又重写并优化了一遍。思路下载《三国演义》txt文档使用jieba分词算法对文档进行分词处理将分词结果踢除停用词、标点符合、非人名等词频统计、并排序可视化展示问题按照上面的思路进行简单实施时,查看结果会发现几个问题名字
三国人物有名、
转载
2023-12-02 16:22:54
231阅读
前言为了顺利完成作业,经过几天的网上查阅完成了[根据第1部分自然语言处理教学内容,请选择一本你喜欢的小说,利用上课讲的但不限于授课内容,对该小说进行分析。比如分析该小说的分词,词频,词性,小说人物出场次数排序,小说中食物排序(这个得有,我喜欢吃),小说人物关系等等]的作业1.需要准备的文件bird.pngsgyy.txt是三国演义原文,自行搜索即可 同理tingyong.txt是停用词,自行搜索即
转载
2024-06-14 11:27:54
172阅读
字符串中的join()方法t = ",".join(['aaa', 'bbb', 'ccc'])
# join()将列表中的元素用指定的分隔符连接起来,连接成一个字符串
print(t) 将《三国演义》中出场频度高的人物名字,通过图片的形式做成词云(名字越大,人物出场频度越高)import j
转载
2024-06-25 22:04:28
101阅读
前言一直以来对自然语言处理和社交网络分析都很感兴趣,前者能帮助我们从文本中获得很多发现,而后者能够让我们对人们和各个事物之间普遍存在的网络般的联系有更多认识。当二者结合,又会有怎样的魔力呢?作为一个三国迷,我就有了这样的想法:能不能用文本处理的方法,得到《三国演义》中的人物社交网络,再进行分析呢?Python中有很多好工具能够帮助我实践我好奇的想法,现在就开始动手吧。 准备工作获得《三国演义》的文
转载
2024-07-23 20:46:33
53阅读
前言:三国演义是我比较喜欢的小说了,记得袁阔成老先生说,《三国演义》是那段历史的一座人才宝库,也是一部活的兵书,是一座军事大课堂。从小喜欢读三国演义,常常为作者的文笔而惊叹。在这本书里,我们看见了过往的,看到了历史璀璨的文化积淀,同时我们也获取到了心灵的养分。很清楚的很深刻的一种感觉就是,史学文化巨著是一种鸡汤,就算我们学会太多的技术也无法代替文话巨著对人类的影响。没有中华文化的熏陶,心灵永远是干