原文连接
Python在数据分析中越来越受欢迎,已经达到了统计学家对R的喜爱程度,Python的拥护者们当然不会落后于R,开发了一个个好玩的数据分析工具,下面我们来看看如何使用Python,来读红楼梦,本文是《用Python读红楼梦》系列文章的第一篇,绘制小说中的词云。
首先当然要导入我们需要用到的包,下面import进来的包,都是我们将在接下来的程序中使用到的包,如果大家还没有安装
转载
2023-11-07 21:24:32
452阅读
作者:Irain 目录1 下载jieba库2 jieba库自带的dict词典3 分词示例3.1分词的三种模式3.2词性标注示例4 词库中更改词5 加载自定义词库6 改变词频7 提取固定数量的关键词8 返回词语的位置8.1 默认模式:返回词语的位置8.2 搜索引擎模式,返回词语的位置9 红楼梦文本分词应用 1 下载jieba库下载命令(为快不破):pip install jieba -i http
题目描述:景区口碑评分值预测题目理解: 读红楼梦,看尽人世百态。自我反省了一下,发现自己的情商(为人处世)方面确实很差,说话太直或许做事太幼稚。从我和别人的对话之中,些许可以被听者听出来。我所说的话,也就是文本,文本的理解就是通过语气以及说话人的历史性格能够推测出来。 这个题目,主要是通过对游客在某平台的留言以及用户主观的评论,需要的任务就是预测
转载
2024-06-29 22:40:27
70阅读
python对文本进行分析和数据可视化,主要运用到了jieba,worldcloudmatplotlib,nxwworkx,pandas库,其他库在代码中给出。 1.首先准备好这三本名著 2.准备好停词词库代码如下:import matplotlib.pyplot as plt
import matplotlib
import networkx as nx
import tkinter
转载
2024-08-01 20:18:01
157阅读
大家好,我是菜鸟哥。相信很多人都知道,《红楼梦》就是中国古典小说的巅峰之作,太多人沉迷其中,而红学也经久不衰。当然今天我们不是来探究小说的,而是通过 Python 来探索下红楼梦里那千丝万缕的人物关系。开干~数据准备红楼梦 txt 电子书一份金陵十二钗 + 贾宝玉 人物名称列表宝玉 nr
黛玉 nr
宝钗 nr
湘云 nr
凤姐 nr
李纨 nr
元春 nr
迎春 nr
探春 nr
惜春 nr
妙
转载
2023-11-01 20:26:59
162阅读
day12 Python中的内置函数 文章目录day12 Python中的内置函数今日内容概要上周内容回顾今日内容详细推导式列表推导式字典推导式和集合推导式生成器表达式(推导式)内置函数一`all`函数`any`函数`callable`函数bytes函数chr和ord函数complex和divmod函数eval和exec函数frozenset函数hash函数help函数进制转换函数pow函数rep
转载
2024-07-30 19:32:47
20阅读
爬虫入门—数据解析基础 bs4库使用之红楼梦全文文本爬取Author: Labyrinthine Leo Init_time: 2021.02.23Key Words: Spider、BeautifulSoup1、需求分析需求:在上一节中,我们大概了解BeautifulSoup库的基本使用,这一节我们将使用bs4库进行实战,对诗词名句网的红楼梦小说文本内容进行爬取,包括每一章的标题和内容,并将
转载
2024-08-14 09:49:33
277阅读
朴素贝叶斯算法简单、高效。接下来我们来介绍其如何应用在《红楼梦》作者的鉴别上。第一步,当然是先得有文本数据,我在网上随便下载了一个txt(当时急着交初稿。。。)。分类肯定是要一个回合一个回合的分,所以我们拿到文本数据后,先进行回合划分。然后就是去标点符号、分词,做词频统计。 1 # -*- coding: utf-8 -*-
2 import re
3 import jieba
4
转载
2024-02-29 10:02:48
141阅读
嗨,大哥们,我来了!《红楼梦》作为我国四大名著之一,古典小说的巅峰之作,粉丝量极其庞大,而红学也经久不衰。所以我们今天通过 Python 来捋一下红楼梦里那错综复杂的人物关系,话不多说,开始整活!一、准备工作红楼梦txt格式电子书一份金陵十二钗+贾宝玉人物名称列表宝玉 nr
黛玉 nr
宝钗 nr
湘云 nr
凤姐 nr
李纨 nr
元春 nr
迎春 nr
探春 nr
惜春 nr
妙玉 nr
巧姐
转载
2023-09-17 19:06:00
208阅读
Python 处理文本是一项非常常见的功能,本文整理了多种文本提取及NLP相关的案例,还是非常用心的。文章很长,要忍一下,如果忍不了,那就收藏吧,总会用到的!提取 PDF 内容提取 Word 内容提取 Web 网页内容读取 Json 数据读取 CSV 数据删除字符串中的标点符号使用 NLTK 删除停用词使用 TextBlob 更正拼写使用 NLTK 和 TextBlob 的词标记化使用 NLTK
系列文章目录 本文目录系列文章目录项目描述语法总览语法点1:基于面向对象进行功能扩展语法点2:正则表达式语法点3:pyecharts折线图具体实现step1:分章节step2:面向对象功能扩展:查词典step3:pyecharts绘图人物共现分析总结 项目描述文本是程序之间的重要介质,文本处理也是编程的重要问题。我们在上一节的基础上,对红楼梦做更多的研究。 github仓库见Honour-Van:
转载
2023-11-23 13:11:10
134阅读
红楼梦文本处理的Python解决方案
在处理《红楼梦》的文本数据时,数据备份与恢复显得尤为重要,特别是在精细化分析文本时。本文将围绕备份策略、恢复流程、灾难场景等方面进行详细探讨,帮助您有效管理《红楼梦》的文本数据。
### 备份策略
首先,制定一个健全的备份策略至关重要。以下是一个备份流程图,展示了完整的备份步骤:
```mermaid
flowchart TD
A[选择备份方式
学习缘由一方面可以通过笔记让我对NPL有关操作有更深的理解,另一方面也希望可以将自己学习过程中遇到的一些问题点出来,避免大家多次入坑,浪费宝贵时间!工欲善其事必先利其器掌握一门中文分词第三方库,我就用jieba分词为例。具备基本的python开发能力,有同学问,何为基本能力呢呢? 呃呃呃。。基本语法总要会把!会使用一个ide软件,这里使用的是pycharm.红楼梦txt文本下载链接:链接:http
转载
2024-01-15 00:42:31
156阅读
【单选题】下面哪些是对注释的不正确理解 _____ 。【单选题】执行下面操作后, list2 的值是 _____ 。 list1 = [4,5,6] list2 = list1 list1[2] = 3【单选题】下列 _____ 不是 Python 合法的标识符。【单选题】Let us all uncertainty on thought.【单选题】下列表达式的值为 True 的是 _____ 。
转载
2024-08-27 12:01:33
63阅读
关于“红楼梦”的 Python 分析,这个项目兼具文学和技术的挑战,结合了许多数据分析和自然语言处理的技能。接下来,我将记录在这个项目中的一些核心步骤和经验,包括环境配置、编译过程、参数调优、定制开发、性能对比以及错误集锦。
## 环境配置
对于这个项目的开发,我们首先需要配置开发环境。以下是所需的工具和库版本:
| 组件 | 版本 |
|-------------|
目录一、设计要求二、设计思路三、运行结果
一、设计要求1)抓取红楼梦第一回至第一百二十回的原文,将原文分别保存在txt中,例如:第一回.txt。 2)将保存的txt,合并成一个红楼梦.txt。网页如下:小说内容如下:二、设计思路代码是红楼梦抓取脚本,旨在从一系列网页中提取内容,这些网页与一个文本相关《红楼梦》。导入库:脚本开始时导入必要的库:requests 用于发起 HTTP 请求,lxml
不要问我为啥是红楼梦,而不是水浒三国或西游,因为我也鉴定的认为,红楼才是无可争议的中国古典小说只巅峰,且不接受反驳!而红楼梦也是我多次反复品读的为数不多的小说,对它的感情也是最深的。数据准备红楼梦 TXT 文件一份金陵十二钗 + 贾宝玉 人物名称列表宝玉 nr
黛玉 nr
宝钗 nr
湘云 nr
凤姐 nr
李纨 nr
元春 nr
迎春 nr
探春 nr
惜春 nr
妙玉 nr
巧姐 nr
秦氏
转载
2023-10-19 18:11:51
157阅读
前言 Python语言简单易用,可读性强。在了解基础语法后,你就可以来尝试解决以下的题目。放心,本系列的文章都对新手非常友好。一、生日悖论生日悖论是指在不少于 23 个人中至少有两人生日相同的概率大于 50%。请你验证一下。import random
n=int(input("样本次数:"))
cou=0
for num in range(n)
转载
2023-11-09 06:11:30
236阅读
应听友要求,根据喜马拉雅上的音频节目『听学编程之Python』整理所得。除了数值外,Python处理字符串特别方便,甚至在编程界,也算是最方便的类型。要掌握哪些入门知识呢?字符串 unicode 列表。1 字符串用单引号或双引号标识。所有的字符都被放在单引号和双引号>>> ' hello' # single quotes
'spam eggs’加法和乘法 索引 查找1.1 字符加
转载
2023-11-22 12:02:36
139阅读
在b站看到有人用知识图谱构建红楼梦的人物关系的知识图谱,跟着做了一遍,在这里记录。1、安装neo4j具体见:2、为python安装py2neo4jpy2neo是一个社区第三方库,通过它可以更为便捷地使用python来操作neo4j这里需要进入python的安装目录下,再进入Scripts里面在dos界面下输入 pip install py2neo出现错误ERROR: Could not
转载
2024-05-05 12:49:59
19阅读