词云以词语为基本单元,根据词语在文本中出现的频率设计不同大小的形状以形成视觉上的不同效果,从而使读者只要“一瞥“即可领略文本的主旨。以下是一个词云的简单示例:
import jieba
from wordcloud import WordCloud
from matplotlib import pyplot as plt
#第1步:打开文本
f=open("news.txt",encoding="utf8")
txt=f.read()
#第2步:分词
lst=jieba.lcut(txt)
txt=" ".join(lst)
#第3步:生成词云
wc=WordCloud(font_path=r"msyh.ttf",background_color="white",width=1200,height=1200,min_font_size=10).generate(txt)
#wc.to_file("n.png") #将词云图片保存到磁盘
#绘制词云
plt.imshow(wc) #用plt显示图片
plt.axis('off') #不显示坐标轴
plt.show() #显示图片