应听友要求,根据喜马拉雅上的音频节目『听学编程之Python』整理所得。除了数值外,Python处理字符串特别方便,甚至在编程界,也算是最方便的类型。要掌握哪些入门知识呢?字符串 unicode 列表。1 字符串单引号或双引号标识。所有的字符都被放在单引号和双引号>>> ' hello' # single quotes 'spam eggs’加法和乘法 索引 查找1.1 字符加
原文连接 Python在数据分析中越来越受欢迎,已经达到了统计学家对R的喜爱程度,Python的拥护者们当然不会落后于R,开发了一个个好玩的数据分析工具,下面我们来看看如何使用Python,来读红楼梦,本文是《Python红楼梦》系列文章的第一篇,绘制小说中的词云。 首先当然要导入我们需要用到的包,下面import进来的包,都是我们将在接下来的程序中使用到的包,如果大家还没有安装
学习缘由一方面可以通过笔记让我对NPL有关操作有更深的理解,另一方面也希望可以将自己学习过程中遇到的一些问题点出来,避免大家多次入坑,浪费宝贵时间!工欲善其事必先利其器掌握一门中文分词第三方库,我就用jieba分词为例。具备基本的python开发能力,有同学问,何为基本能力呢呢? 呃呃呃。。基本语法总要会把!会使用一个ide软件,这里使用的是pycharm.红楼梦txt文本下载链接:链接:http
关于“红楼梦”的 Python 分析,这个项目兼具文学和技术的挑战,结合了许多数据分析和自然语言处理的技能。接下来,我将记录在这个项目中的一些核心步骤和经验,包括环境配置、编译过程、参数调优、定制开发、性能对比以及错误集锦。 ## 环境配置 对于这个项目的开发,我们首先需要配置开发环境。以下是所需的工具和库版本: | 组件 | 版本 | |-------------|
目录一、设计要求二、设计思路三、运行结果 一、设计要求1)抓取红楼梦第一回至第一百二十回的原文,将原文分别保存在txt中,例如:第一回.txt。 2)将保存的txt,合并成一个红楼梦.txt。网页如下:小说内容如下:二、设计思路代码是红楼梦抓取脚本,旨在从一系列网页中提取内容,这些网页与一个文本相关《红楼梦》。导入库:脚本开始时导入必要的库:requests 用于发起 HTTP 请求,lxml
不要问我为啥是红楼梦,而不是水浒三国或西游,因为我也鉴定的认为,红楼才是无可争议的中国古典小说只巅峰,且不接受反驳!而红楼梦也是我多次反复品读的为数不多的小说,对它的感情也是最深的。数据准备红楼梦 TXT 文件一份金陵十二钗 + 贾宝玉 人物名称列表宝玉 nr 黛玉 nr 宝钗 nr 湘云 nr 凤姐 nr 李纨 nr 元春 nr 迎春 nr 探春 nr 惜春 nr 妙玉 nr 巧姐 nr 秦氏
转载 2023-10-19 18:11:51
157阅读
前言        Python语言简单易用,可读性强。在了解基础语法后,你就可以来尝试解决以下的题目。放心,本系列的文章都对新手非常友好。一、生日悖论生日悖论是指在不少于 23 个人中至少有两人生日相同的概率大于 50%。请你验证一下。import random n=int(input("样本次数:")) cou=0 for num in range(n)
python对文本进行分析和数据可视化,主要运用到了jieba,worldcloudmatplotlib,nxwworkx,pandas库,其他库在代码中给出。 1.首先准备好这三本名著 2.准备好停词词库代码如下:import matplotlib.pyplot as plt import matplotlib import networkx as nx import tkinter
在b站看到有人知识图谱构建红楼梦的人物关系的知识图谱,跟着做了一遍,在这里记录。1、安装neo4j具体见:2、为python安装py2neo4jpy2neo是一个社区第三方库,通过它可以更为便捷地使用python来操作neo4j这里需要进入python的安装目录下,再进入Scripts里面在dos界面下输入 pip install py2neo出现错误ERROR: Could not
Python红楼梦词频分析是一个非常有趣且富有挑战性的项目。我们将通过多个步骤实现对《红楼梦》文本的词频分析,包括数据的准备、分析过程、结果的可视化及优化。在整个过程中,我们会注意版本对比、迁移指南、兼容性处理等关键点,确保我们能够高效、准确地完成这一任务。 ## 版本对比 在开始之前,我们需要了解不同Python版本的特性差异,特别是对于文本处理和数据分析库的支持。这对于确保我们的词频分析
原创 7月前
27阅读
大家好,我是菜鸟哥。相信很多人都知道,《红楼梦》就是中国古典小说的巅峰之作,太多人沉迷其中,而红学也经久不衰。当然今天我们不是来探究小说的,而是通过 Python 来探索下红楼梦里那千丝万缕的人物关系。开干~数据准备红楼梦 txt 电子书一份金陵十二钗 + 贾宝玉 人物名称列表宝玉 nr 黛玉 nr 宝钗 nr 湘云 nr 凤姐 nr 李纨 nr 元春 nr 迎春 nr 探春 nr 惜春 nr 妙
day12 Python中的内置函数 文章目录day12 Python中的内置函数今日内容概要上周内容回顾今日内容详细推导式列表推导式字典推导式和集合推导式生成器表达式(推导式)内置函数一`all`函数`any`函数`callable`函数bytes函数chr和ord函数complex和divmod函数eval和exec函数frozenset函数hash函数help函数进制转换函数pow函数rep
爬虫入门—数据解析基础 bs4库使用之红楼梦全文文本爬取Author: Labyrinthine Leo   Init_time: 2021.02.23Key Words: Spider、BeautifulSoup1、需求分析需求:在上一节中,我们大概了解BeautifulSoup库的基本使用,这一节我们将使用bs4库进行实战,对诗词名句网的红楼梦小说文本内容进行爬取,包括每一章的标题和内容,并将
转载 2024-08-14 09:49:33
277阅读
嗨,大哥们,我来了!《红楼梦》作为我国四大名著之一,古典小说的巅峰之作,粉丝量极其庞大,而红学也经久不衰。所以我们今天通过 Python 来捋一下红楼梦里那错综复杂的人物关系,话不多说,开始整活!一、准备工作红楼梦txt格式电子书一份金陵十二钗+贾宝玉人物名称列表宝玉 nr 黛玉 nr 宝钗 nr 湘云 nr 凤姐 nr 李纨 nr 元春 nr 迎春 nr 探春 nr 惜春 nr 妙玉 nr 巧姐
作者:Irain 目录1 下载jieba库2 jieba库自带的dict词典3 分词示例3.1分词的三种模式3.2词性标注示例4 词库中更改词5 加载自定义词库6 改变词频7 提取固定数量的关键词8 返回词语的位置8.1 默认模式:返回词语的位置8.2 搜索引擎模式,返回词语的位置9 红楼梦文本分词应用 1 下载jieba库下载命令(为快不破):pip install jieba -i http
python对文本进行分析和数据可视化,主要运用到了jieba,worldcloudmatplotlib,nxwworkx,pandas库,其他库在代码中给出。 1.首先准备好这三本名著 2.准备好停词词库代码如下:import matplotlib.pyplot as plt import matplotlib import networkx as nx import tkinter
转载 2024-08-01 20:18:01
157阅读
day051.请将列表中的每个元素通过 "_" 链接起来。users = ['西游记','红楼梦','三国演义']users = ['西游记','红楼梦','三国演义'] print("_".join(users)) users = ['西游记','红楼梦','三国演义'] print("_".join(users))users = ['西游记','红楼梦','三国演义'] ls = "" for
转载 2024-06-15 19:56:56
33阅读
【单选题】下面哪些是对注释的不正确理解 _____ 。【单选题】执行下面操作后, list2 的值是 _____ 。 list1 = [4,5,6] list2 = list1 list1[2] = 3【单选题】下列 _____ 不是 Python 合法的标识符。【单选题】Let us all uncertainty on thought.【单选题】下列表达式的值为 True 的是 _____ 。
红楼梦》是我国古代四大名著之一,是一部具有世界影响力的人情小说作品,举世公认的中国古典小说巅峰之作,中国封建社会的百科全书,传统文化的集大成者。那么问题来了,许多人都有读完书后整理成读书笔记的习惯,那么对于红楼梦这样复杂深刻而又知识点满满的书籍,应该怎样去整理呢?本文通过思维导图的整理方式,你不妨一看。一、红楼梦人物关系整理来了(建议收藏)像红楼梦这样复杂的长篇小说,屡清人物关系是最基本也是最首
1、《红楼梦引子》   开辟鸿蒙,谁为情种?都只为风月情浓。趁着这奈何天,伤怀日,寂寥时,试遣愚衷。因此上,演出这怀金悼玉的《红楼梦》。  2、《终身误》  都道是金玉良姻,俺只念木石前盟。空对着,山中高士晶莹雪;终不忘,世外仙姝寂寞林。叹人间,美中不足今方信。纵然是齐眉举案,到底意难平。  3、《枉凝眉》  一个是阆苑仙葩,一个是美玉无瑕。若说没奇缘,今生偏又遇着他;若说有奇缘,如何心事终虚化?
原创 2022-12-06 15:44:19
126阅读
  • 1
  • 2
  • 3
  • 4
  • 5