词云图的生成原理:程序会将这篇文章中的所有词组识别出来,然后统计每个词组出现的次数,出现次数越多,词组的字号越大,最后把所有词组拼合成一张图像,也就是我们想要的词云图。我们需要把这篇文章储存在一个txt文档里,把这个文档和程序放在同一个文件夹下。
pycharm制作方法:首先需要安装好了python的运行环境,并且以pycharm作为默认工具,安装所需的第三方库,它们分别是jieba 和wordcloud.安装可以参考:https://www.jb51.net/article/141320.htm然后开始制作词云程序。在pycharm中新建一个python文件。首先调用jieba和worldcloud模块。
import jieba
import worldcloud接着,我们把储存在程序目录下的txt文档命名为”b站测试题.txt”在程序中输入以下代码来读取这个文档。
f=open(“b站测试题.txt”,”r”,encoding=”gbk”)现在我们要读取文档中的文字,把它储存在一个新的变量t中
t=f.read()然后关闭文档
f.close()然后提取词组
Is=jieba.icut(t)
Txt=” ”.join(Is)现在我们已经将词组提取出来并用空格分开,提取出来的词组保存在一个新的变量txt 里面下一步我们要新建一个词云的对象,并设定一些参数
W=wordcloud.wordcloud(width=2000,
Height=1400,
Font_path=”msyh.ttc”
)在上面这段代码中,我们新建了一个词云的对象并将其命名为w。我们设定生成词云图片的宽度为2000像素,高度为1400像素,设定文字的字体为微软雅黑。现在我们要把之前生成的词组变量txt导入词云对象w中。
w.generate(txt)
w.to_file(“pic.png”)然后运行测试打开程序所在的文件夹,我们可以看到这里生
成了一个名为pic.png的图片文件。
还可以进行个性化,譬如换个背景色
只需要加入一行代码:W=wordcloud.wordcloud(width=2000, Height=1400,
Background_color=”Grey” Font_path=”msyh.ttc”)颜色可以查询下表
也可以用16进制数值模式,以#开头的6位16进制数表示颜色,你可以在下面这个网站上找到自己想要的颜色的16进制颜色数值。
也可以使用colormap改变
文字颜色还以自定义
词云显示行状,譬如奔马、五角星等我们需要准备一张白色背景的图片,将其放到程序所在的文件夹里,程序会把白色的背景抠除,将文字放在主体部分,再填充上背景颜色。这里我选了一个五角星的图片,将它放置在程序所在的目录下
现在我们需要调用一个新的库:imageio,imageio是python自带的一个库,可以用来读取图像数据。在程序开头添加下面的代码:
import imageio然后建立一个变量mask来读取图像数据
Mask=imageio.imread(“五角星.png”)然后我们需要在建立词云对象的代码中添加一行代码W=wordcloud.wordcloud(width=2000, Height=1400, Font_path=”msyh.ttc”
Mask=mask, )运行,如下图:
思路参考:威海市文登区七里汤中学宋海霞《用python生成词云图》
方法二:除了用Pycharm还可以用sublime,可以参考:未来的编程就这样,很多基础的功能已经函数或者库化了,直接调用就可以了。这样避免了频繁的制造锤子,譬如上面程序中提取词组的代码、生成词云的代码根本不用自己去从零写,只需要加载调用就行了,极大提高编程效率,但是这些库大部分都是国外开发的,国内直接“拿来主义”了,未来会有越来越多的国产库了。如果你仅仅是为了兴趣或者经过严格训练的程序员可以使用,如果是初学编程,希望学习编程,那请不要忽视自己自作“锤子”。