# Python 统计人物分类入门指南 作为一名刚入行的小白,学习如何用Python进行人物分类统计可能会让你感到困惑。本文将会带你一步步完成整个流程,通过明确的步骤和代码示例帮助你理解。 ## 整体流程 我们将通过以下步骤来实现“Python 统计人物分类”: | 步骤 | 说明 | |-------|------------
原创 9月前
31阅读
   《红楼梦》作为我国四大名著之一,古典小说的巅峰之作,粉丝量极其庞大,而红学也经久不衰。所以我们今天通过 Python 来探索下红楼梦里那千丝万缕的人物关系,话不多说,开始整活!一、准备工作红楼梦txt格式电子书一份金陵十二钗+贾宝玉人物名称列表宝玉 nr 黛玉 nr 宝钗 nr 湘云 nr 凤姐 nr 李纨 nr 元春 nr 迎春 nr 探春 nr 惜春 nr 妙玉 nr
相信很多人都知道,《红楼梦》就是中国古典小说的巅峰之作,太多人沉迷其中,而红学也经久不衰。当然今天我们不是来探究小说的,而是通过 Python 来探索下红楼梦里那千丝万缕的人物关系开干~数据准备红楼梦 txt 电子书一份金陵十二钗 + 贾宝玉 人物名称列表 宝玉 nr 黛玉 nr 宝钗 nr 湘云 nr 凤姐 nr 李纨 nr 元春 nr 迎春 nr 探春 nr 惜春 nr 妙玉 nr 巧姐 nr
人名最多数统计描述编程模板中给出了一个字符串,其中包含了含有重复的人名,请直接输出出现最多的人名。‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬ ‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪
# Python 实现《红楼梦》人物统计 在这篇文章中,我们将一起实现一个统计《红楼梦》中人物出现频率的Python程序。这个过程将从构思、准备数据、编写代码到最后的数据可视化,我们将一步一步地进行。 ## 流程概述 以下是我们完成这个任务的主要步骤: | 步骤 | 描述 | |------|------| | 1 | 收集《红楼梦》文本数据 | | 2 | 预处理文本 | |
原创 9月前
331阅读
前面文章已经具体讲解了对统计《三国演义》人物名称出现次数的操作和实现思路,如有需要可以浏览。初级实现代码import jieba excludes = {"什么","一个","我们","那里","如今","你们","说道","起来", "姑娘","这里","出来","他们","众人","奶奶","自己","一面", "太太","只见","怎么","两
转载 2023-11-10 09:21:14
464阅读
双字及以上搜索:快,但不够精确,比如“懿”,“瑜”,“郃(武将张郃)”的未被查找带来排序误差。上代码1:import jieba txt=open('threekingdoms.txt','r',encoding='utf-8').read() words=jieba.lcut(txt) counts={} #创建空字典 #excludes集合由多次迭代运行逐步完善至不影响前15名结果 exclu
先看效果,我们的冠词"热"以929次高居榜首核心知识简单的文件读取 字典 列表 尤其是字典和列表,需要了解清楚才能理解代码步骤读取txt文件,并将所有的标点符号替换为空格将文件分解成一个一个的单词使用字典一个一个的复制单词作为键,遇到相同的键其对应的值就+1将字典转化为列表,并按值大小从大到小排序循环输出结果代码def getTxt(): # 打开相对路径,需要两个省略号点.表示本项目
## Python红楼梦人物出场统计 ### 引言 《红楼梦》是中国古代四大名著之一,也是中国古代小说的巅峰之作。其中涉及了众多的人物角色,每个角色都有着自己的故事和命运。为了更好地了解《红楼梦》中各个人物的出场情况,我们可以借助Python进行人物出场统计分析。 ### 准备工作 在开始之前,我们需要先准备一份《红楼梦》的文本数据,可以从互联网上下载《红楼梦》的电子版文档,例如txt格式。将
原创 2023-08-26 08:08:44
1071阅读
前言看到用机器学习方法分析红楼梦的文章不少,也有好几种方法,大观是因为纯文字的分析成本低吧,比较适合初学者练手,先转一两篇文章过来学习。所谓机器学习也是一些数学统计的方法,通过习惯用词来做判断, 也并不是很难。这里判定的维度越多越精准,下面判定仅供参考,仅供娱乐学习! 判定整体思路主要从以下几个方面可以进行粗略进行判定:1.写作习惯每个人写作都有一些与种不同的小习惯,这些小习惯并不会轻易就会发生改
前言python中文分析作业,将对《射雕英雄传》进行中文分析,统计人物出场次数、生成词云图片文件、根据人物关系做社交关系网络和其他文本分析等。对应内容1.中文分词,统计人物出场次数,保存到词频文件中,文件内容为出场次数最多的前 300 人(可大于 300)的姓名和次数# -*- coding: utf-8 -*- import jieba def getText(filepath): # 传入
本文首先使用jieba分词提取出红楼梦人物及出现次数,然后使用pyecharts进行可视化。文本分词并非重点关注,主要是做pyecharts的可视化练习。import pandas as pd import jieba import re from pyecharts.globals import CurrentConfig, OnlineHostType CurrentConfig.ONLINE
转载 2023-12-14 18:51:51
1538阅读
文章目录31.Pandas和数据库查询语言SQL的对比32.Pandas实现groupby聚合后不同列数据统计32.1 聚合后单列-单指标统计32.2 聚合后单列-多指标统计32.3 聚合后多列-多指标统计33.Pandas将Excel存入MySQL33.1 方法1:当数据表不存在时,每次覆盖整个表33.2 方法2:当数据表存在时,每次新增数据34.Pandas处理Excel复杂多列到多行转换3
转载 7月前
25阅读
在《平凡的世界》这本书中,数个角色贯穿其中,他们的悲欢离合为我们展现了一个时代的缩影。对于读者来说,了解这些角色在文本中的出现频率不仅可以帮助深入理解故事情节,还能让我们更好地回忆起故事的细节。因此,这里,我将介绍如何用Python统计《平凡的世界》中人物的出现次数,进而分析文本。 ### 协议背景 在统计人物出现次数时,我们可以将其视作文本分析的一种形式。文本分析能够帮助我们从非结构化数据中
原创 5月前
22阅读
在这个博文中,我将详细记录如何使用Python对《红楼梦》中的人物进行统计,并找出前30的人物。这个过程包括从问题背景的分析,到错误现象,根因分析、解决方案的实施,验证测试以及预防和优化的建议。 ## 问题背景 《红楼梦》被视为中国文学的经典,在教育和文化研究中具有重要的地位。然而,随着文本复杂度的增加,关于其人物的分析成为了一个挑战。因此,进行人物统计不仅能助于研究,也有助于普及相关知识。业
原创 5月前
67阅读
“滚滚长江东逝水,浪花淘尽英雄”。近来读《三国演义》,忽然想看看到底哪位英雄在书中提到的最多,于是就想用分词算法实现一下。 网上也确实有相关的案例,作为参考,自己又重写并优化了一遍。思路下载《三国演义》txt文档使用jieba分词算法对文档进行分词处理将分词结果踢除停用词、标点符合、非人名等词频统计、并排序可视化展示问题按照上面的思路进行简单实施时,查看结果会发现几个问题名字 三国人物有名、
在本文中,我们将探讨如何使用Python统计《红楼梦》中人物的出场次数。这个过程不仅涉及到文本处理操作,还包括统计方法和数据分析的基本知识。接下来,我们将详细阐述我们的思路与过程。 ### 背景定位 在中文文学中,《红楼梦》被广泛认为是经典之作,书中的人物生动且众多。对这些人物的出场次数进行统计,有助于更好地理解这部作品的结构与深义。本项目的技术定位在于数据分析和文本处理领域,主要使用Pyt
在现代社会中,小说中的人物形象对故事发展至关重要。尤其是在分析和统计某些经典文学,如《平凡的世界》中的人物出现次数时,Python提供了强大的工具能够帮助我们高效地完成这项任务。本文将为你详细介绍如何使用Python统计《平凡的世界》中人物出现的次数,帮助你理解书中的角色及其重要性。 ## 环境准备 在我们开始之前,首先要确保你的Python环境配置正确。以下是相关的软件依赖: | 依赖项
原创 5月前
35阅读
# Python 统计《红楼梦》的关键人物 《红楼梦》是中国古典小说的巅峰之作,其中的人物众多且各具特色。对于这个小说的分析,我们可以使用Python进行数据处理和可视化工作。本文将介绍如何通过Python统计《红楼梦》的关键人物,并结合数据可视化手段,使得分析结果更加直观。 ## 1. 数据准备 首先,我们需要从《红楼梦》中提取出角色的数据。通常情况下,对于这部小说的分析,使用文本挖掘是比
原创 7月前
51阅读
    这周老师布置了一项作业,让我们回去将自己喜欢的小说里面的主角出场次数统计出来,我对这个充满了兴趣,但我遇到了三个问题:(1)一开始选了一部超长的小说(最爱之一),但是运行时老是不行,老是显示下图错误:(2)我一开始是像书本那样直接把txt文件名打上去,类似于open(‘two.txt’,'r').read(),但总是出现一下一行字:(3)三个字的人名总是会有几个人只打了
  • 1
  • 2
  • 3
  • 4
  • 5