python - 制作简单 ‘词云图‘

原创

peerslee 2022-10-28 12:07:56 ©著作权

文章标签 python wordcloud 背景图背景颜色下载地址 文章分类 运维

©著作权归作者所有：来自51CTO博客作者peerslee的原创作品，请联系作者获取转载授权，否则将追究法律责任

import jieba
from jieba.analyse import extract_tags
from scipy.misc import imread
from wordcloud import WordCloud

import matplotlib.pyplot as plt

def generater(**kwargs):
    content_name = kwargs['content_name']
    content_path = './{}.txt'.format(content_name)
    top_k = kwargs['top_k']
    bg_name = kwargs['bg_name']
    color = kwargs['color']
    font_type = kwargs['font_type']

    with open(content_path, mode='r', encoding='utf-8') as f:
        content = f.read()
    '''
    根据TF/IDF提取topK个关键词
    '''
    tags = extract_tags(sentence=content, topK=top_k)
    '''
    得到关键词的词频
    '''
    # 全模式
    words = [word for word in jieba.cut(content, cut_all=True)]
    words_freq = {}
    for tag in tags:
        freq = words.count(tag)
        words_freq[tag] = freq
    '''
    设置背景
    scipy.misc imread()：返回的是 numpy.ndarray 也即 numpy 下的多维数组对象
    '''
    bg_path = './{}.png'.format(bg_name)
    bg_img = imread(bg_path)
    font_path = './{}.ttf'.format(font_type)
    word_cloud = WordCloud(font_path=font_path, # 设置字体
                           background_color=color, # 背景颜色
                           max_words=top_k, # 词云显示的最多词数
                           max_font_size=100, # 字体最大
                           mask=bg_img, # 背景图
                           )
    word_cloud.generate_from_frequencies(words_freq)

    plt.imshow(word_cloud)
    plt.axis('off') # 不显示坐标轴
    plt.show()

    # 保存图片
    word_cloud_img = './{}_word_cloud.jpg'.format(content_name)
    word_cloud.to_file(word_cloud_img)

if __name__ == '__main__':
    generater(content_name=' xx xx ',
              top_k=66,
              bg_name='china', # 默认png
              color='black',
              font_type='wryh')

链接: https://pan.baidu.com/s/1bp8dPa3密码: ujxc

windows 安装 wordcloud

下载地址

pip install  wordcloud-1.3.1-cp36-cp36m-win_amd64.whl

上一篇：Java - Spring boot - （初嗅）

下一篇：python3 - jieba：去停词，词性判断，计算词频

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯