Python初学者,目前为止初步学完了基础语法和常用库的操作。“《三国演义》词云”是近期归纳学习心得期间一时兴起做来练手的,水平极其有限,仅作记录。自学Python强推北京理工大学嵩天教授的MOOC:Python语言程序设计;课件的深度设置地很舒服,非常适合零基础入门或者有数据分析需求但是无意深挖技术的听众。以上为背景1. 语料与外部库:三国演义全文txt格式语料:Python123.i
转载
2023-12-09 16:58:16
287阅读
使用python统计《三国演义》小说里人物出现次数前十名,并实现可视化。
python统计三国演义里的人物出场次数
一、安装所需要的第三方库jieba (jieba是优秀的中文分词第三分库)
pyecharts (一个优秀的数据可视化库)《三国演义》.txt下载地址(提取码:kist )使用p
转载
2023-06-26 15:05:56
1074阅读
1.目标
python爬取三国演义,生成词云、图表
2.码前须知
项目目标:三国人物名称及出现次数-----数据统计分析
提出问题:哪个人物在三国演义中出现的次数最多?,我们希望通过数据分析来获得答案。
分析工具:pandas,Matplotlib
pip install bs4
pip install lxml
pip install pandas
pip install Matplotlib
转载
2024-06-17 03:39:54
349阅读
文章目录效果展示介绍软件架构使用说明导入需要的库执行main.py 这里以三国演义为例 三国演义.txt alice_mask.png效果展示介绍Python读取小说文本,绘制词云图,主要人物出场次序,社交网络关系图,章回字数软件架构环境准备:Python3 主要模块:networkx wordcloud matplotlib pyecharts imageio jieba使用说明导入需要的库
转载
2023-08-07 19:22:19
512阅读
总览前言功能函数与展示获取本地txt文件内容将停用词文件的词读入到列表stopwords中分词并统计词频分词结果词云更换词云形状章回统计统计每一回中玄德出现的次数统计“曹贼”“大耳贼”“美髯公”"汉贼"三国兴衰平均段落数与字数社交网络换一种布局代码获取 前言本项目主要利用python的jieba库对三国演义进行词频分析,并通过WordCloud、networkx,matplotlib等库进行可视
转载
2023-12-17 10:07:40
432阅读
1.目标
python爬取三国演义,生成词云、图表
2.码前须知
项目目标:三国人物名称及出现次数-----数据统计分析
提出问题:哪个人物在三国演义中出现的次数最多?,我们希望通过数据分析来获得答案。
分析工具:pandas,Matplotlib
pip install bs4
pip install lxml
pip install pandas
pip install Matplotlib
转载
2023-12-30 20:10:13
113阅读
第001回 宴桃园豪杰三结义 斩黄巾英雄首立功 第002回 张翼德怒鞭督邮 何国舅谋诛宦竖 第003回 议温明董卓叱丁原
原创
2022-07-25 10:32:33
1394阅读
嗯,是《三国演义》,不是《三国志》。个人觉得如果不是学者,不一定要探究历史的每个细节,而是要从历史上发生的事情中得到经验,映射到自己或者当今社会中,便会有所感悟,有所收获。 先说汉朝 东汉末年,汉室倾覆。为什么?原因在于东汉的皇帝都很短命,为什么短命?近亲结婚?有的说法是皇后为了想专政,故意废长立幼
原创
2021-11-14 10:46:38
246阅读
# Python三国演义分词
《三国演义》是中国古代四大名著之一,描绘了中国历史上的三国时期的政治斗争、战争与英雄豪杰。在现代社会中,自然语言处理技术的发展使得我们可以利用计算机来对文本进行分析和处理。本文将介绍如何使用Python进行《三国演义》文本的分词处理。
## 什么是分词?
分词是将一段连续的文本切割成一个个有意义的词语的过程。例如,对于句子“我喜欢Python编程”,分词的结果可
原创
2023-07-27 18:50:26
210阅读
前言为了顺利完成作业,经过几天的网上查阅完成了[根据第1部分自然语言处理教学内容,请选择一本你喜欢的小说,利用上课讲的但不限于授课内容,对该小说进行分析。比如分析该小说的分词,词频,词性,小说人物出场次数排序,小说中食物排序(这个得有,我喜欢吃),小说人物关系等等]的作业1.需要准备的文件bird.pngsgyy.txt是三国演义原文,自行搜索即可 同理tingyong.txt是停用词,自行搜索即
转载
2024-06-14 11:27:54
172阅读
刚学完英文词频统计,现在我们来看一下中文人物出场统计下面我们以《三国演义》为例,进行统计分析一、解题思路1.jieba库的使用jieba库是优秀的中文第三方库,利用jieba库我们可以对中文文本分词获得单个的词语2.词语筛选本次统计的目的是获取《三国演义》中的人物出场次数,这就要求我们对词语进行筛选,筛除一个字的词语(不可能是人名)通过对输出的结果进行分析,将不符合的词语进行筛除,不断重复该步骤,
转载
2024-01-04 19:58:11
991阅读
将三国演义.txt内容进行词云可视化安装jieba和wordcloud,cmd进入终端pip install jieba
pip install wordcloudCode:import jieba
from matplotlib import pyplot as plt
from wordcloud import WordCloud
from PIL import Image
import nu
转载
2024-07-23 17:18:05
266阅读
导入模块1.jieba的安装与使用pip install jieba
conda install -c conda-forge jiebaPython2.X版全自动安装:easy_install jieba 或者 pip install jieba
半自动安装:先下载http://pypi.python.org/pypi/jieba/ ,解压后运行python set
转载
2024-07-23 11:47:14
725阅读
上一篇简单回顾了华为手机成立十四年的发展道路,今天继续聊聊这个行业几家热门厂商。首先,手机这个行业确实不太
原创
2021-07-14 10:38:23
101阅读
1、网页URL: http://www.shicimingju.com/book/sanguoyanyi.html 1.1 注意安装环境 pip install bs4 pip install lxml(解析器) 1.2 数据解析原理: 1.2.1 标签定位 1.2.2 提取标签、标签属性中存储的数据值 1.3 bs4数据解析的原理:(bs4只能用于python) 1.3.1实例化一个Beauti
# 用Python绘制《三国演义》词云图
《三国演义》是中国古代著名的历史小说,描绘了东汉末年到三国时期的众多英雄人物和战争故事。在数据可视化领域,词云(Word Cloud)是一种常用的图形展示方式,它可以直观地显示文本数据中词汇的出现频率。本文将介绍如何使用Python绘制《三国演义》的词云图,并提供相关代码示例。
## 第一部分:环境准备
在开始之前,我们需要确保安装了以下Python
上一篇简单回顾了华为手机成立十四年的发展道路,今天继续聊聊这个行业几家热门厂商。首先,手机这个行业确实不太好混。昔日的霸主诺基亚已经彻底消失,如日中天的三星也因为note7的爆炸预计损失高达50亿美金,而国内的手机厂商更是你方唱罢,我登场。本文重点回顾下国内热门厂商,小米,oppo&vivo,华为几家,这几家又恰好有点像手机行业的三国演义。一、小米虽然最近小米难掩衰败的气象,但是雷军在20
原创
2021-03-16 22:19:27
243阅读
# Python获取《三国演义》人物名单代码及科普
## 介绍
《三国演义》是中国四大名著之一,是由明代小说家罗贯中创作的一部历史小说。这部小说以三国时期(公元184年-280年)为背景,描绘了魏、蜀、吴三个国家之间的战争和英雄人物的故事。
本文将介绍如何使用Python获取《三国演义》中的人物名单,并使用数据可视化工具进行分析。
## 代码示例
下面是获取《三国演义》人物名单的Pyth
原创
2023-09-13 06:22:04
540阅读
目标统计三国演义中出现次数前100,并绘制云图准备分析工具:jieba,pandas,matplotlib,wordcloud
数据文档:三国演义.txt(原著),三国人物.txt(三国人名,大约1000多个),三国字.txt(一些常见人名及字,约800)
这些文档,放到了后面说明1、并不是严格的人物出场次数,有时可能只是提到,也算进去了
2、可能有jieba分词不准确的地方,并且由于是古典小说,
转载
2023-12-28 15:01:08
201阅读
前面分析统计了金庸名著《倚天屠龙记》中人物按照出现次数并排序然后使用pyecharts,统计B站某视频弹幕内容,并绘制成词云显示 这次,就用分析统计下《三国演义》这部书里各角色出现的频率,并绘制成词云显示,看看谁是绝对的主角吧 首先,我们需要把这部书里出现的人物都枚举出来,毕竟只统计角色信息,不需要把非人物名也统计进来角色 = {'刘备','诸葛亮','关羽','张飞','刘禅
转载
2023-12-08 21:58:12
627阅读