python绘制变形云图 python制作云图

关注 AIGC创想家

python绘制变形云图 python制作云图

转载

AIGC创想家 2023-08-25 00:53:57

文章标签 python绘制变形云图 python 词云图初学词云 文章分类 Python 后端开发

【写在前面】

以前看到过一些大神制作的词云图，觉得效果很有意思。如果有朋友不了解词云图的效果，可以看下面的几张图（图片都是网上找到的）；

python绘制变形云图 python制作云图_词云图

python绘制变形云图 python制作云图_词云_02

网上找了找相关的软件，有些软件制作还要付费。结果前几天在大神的公众号里的文章中看到了python也能实现，而且效果也很不错。那还等什么，不赶紧盘它？

【示例代码】

# coding=utf-8
# @Auther : "鹏哥贼优秀"
# @Date : 2019/7/31
# @Software : PyCharm
import numpy as np
import jieba
from PIL import Image
from wordcloud import WordCloud, STOPWORDS
import matplotlib.pyplot as plt

def draw_word_cloud(word):
    words = jieba.cut(word)
    wordstr = " ".join(words)
    sw = set(STOPWORDS)
    sw.add("ok")
    mask = np.array(Image.open('2.jpg'))
    wc = WordCloud(
        font_path='C:/Windows/Fonts/simhei.ttf',  # 设置字体格式
        mask=mask,
        max_words=200,
        max_font_size=100,
        stopwords=sw,
        scale=4,
    ).generate(wordstr)

    # 显示词云图
    plt.imshow(wc)
    plt.axis("off")
    plt.show()
    # 保存词云图
    wc.to_file('result.jpg')

if __name__ == "__main__":
    with open("test2.txt", "rb") as f:
        word = f.read()
    draw_word_cloud(word)

【效果如下】

python绘制变形云图 python制作云图_初学_03

【知识点】

1、词云图制作前，需要先准备几个东西：

（1）下载python wordcloud库，也是词图库制作的关键库。我在下载这个库时，经常因为网络超时导致下载失败，怎么办呢？多试几次呗；

（2）numpy库，用于图片处理，将图片读取后解析成数组；

（3）如果要对中文句子进行分词，那么需要jieba库；如果是英文分词，那可以不下载；

（4）如果要在界面上直接展示词云图，那么需要matlplotlib来画图；

（5）要处理图片，根据少不了PIL，毕竟它可是官方的图像处理库；

2、接下来，就是准备要分析的内容。示例代码中的txt内容，是我上一篇文章。然后就是词云图的形状。示例代码中的图片2.jpg原图如下：

python绘制变形云图 python制作云图_初学_04

3、准备工作做完了，那自然就开始编码了。

（1）jieba.cut（）：就是对txt内容进行分词了，注意得到的是个generator，因此需要将其转成字符串；当然也可以使用jieba.lcut（），这样得到的就是列表了；

（2）STOPWORDS集合的设置：停用词有什么呢？主要是对一些你不想要的单词进行过滤，比如“好的”“可以”这类单词。另外，在对停用词进行过滤时，有两种方法，一种是像示例代码，将stopwords作为wordcloud方法的参数，这样最简单；也可以自己写段代码，人为过滤停用词；

（3）将你要的词云图形状图片打开，并作为参数传给wordcloud方法

（4）wordcloud方法各参数的意义，可以参考其他帖子：

里面我想着重讲的是regexp参数，即正则表达式。没错，就是正则表达式，有了这个参数，我们可以用正则表达式规则进一步实现自己的单词过滤，比如\d只显示数字。我之前遇到过这个坑，下面再讲。

另外，scale=4生成的图片一般是500KB左右，如果不填，默认只有10几KB；

（5）对内容进行生成词云图时，generate方法最简单，直接将字符串传进来就可以；generate_from_frequencies方法的话，需要传入字典，并自己统计好每个单词的次数；

（6）界面显示词云图的代码很简单，axis("off")是为了不显示坐标，这样更美观；

（7）即将生成的词云图保存到本地，也不多解释。

综上，大致就是示例代码的流程，是不是蛮简单的？那自己动手来玩一次吧。

4、下面我再讲讲自己在制作词云图遇到的坑。

一开始我是想对各期双色球号码进行词云图分析的，结果一直报错，错误如下：

ValueError: We need at least 1 word to plot a word cloud, got 0.

意思就是说我传入的wordstr是空的？怎么可能呢，我明明有数字呀？最后我在wordcloud方法的官方说明中找到了原因：

python绘制变形云图 python制作云图_python绘制变形云图_05

看到没？regexp参数如果不填写的话，默认是会自动过滤掉单个词的，因此数字就是因为这个原因一直被过滤了。怎么解决呢？有两个办法，第一就是传入regexp参数，比如regexp="\d*"；第二种方法就是用

generate_from_frequencies方法，这样因为有每个数字的频繁在，就不会自动被过滤掉了。从我自己的使用结果来看，还是用第二种方法的效果好看点。

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

赞
收藏
评论
分享
举报

上一篇：java判断异步线程是否执行完毕 java异步查询

下一篇：python3 声明编码 python 开头声明编码

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

举报文章

请选择举报类型

内容侵权涉嫌营销内容抄袭违法信息其他

具体原因

包含不真实信息涉及个人隐私

原文链接（必填）

补充说明

0/200

上传截图

格式支持JPEG/PNG/JPG，图片不超过1.9M

已经收到您得举报信息，我们会尽快审核

鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 24年11月软考 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

51CTO博客

首页
关注
排行榜
精品课程
免费资料
软考题库

科目全、试题精、讲解专业，扫码免费刷

搜索历史清空

热门搜索

查看【】的结果
写文章
创作中心
登录注册