一、简介
WordCloud是Python的第三方库,用来制作词云、文字云、标签云。
对文本中出现频率较高的“关键词”予以视觉化的展现。
个人感觉使用WordCloud给人数据直观性。
二、安装步骤运行环境:Pycharm,Python3.74
1、找到第三方库下载地址https://www.lfd.uci.edu/~gohlke/pythonlibs/#wordcloud 2、根据自己的Python版本、操作系统位数下载对应的WordCloud
①如何查看自己的Python版本?windows+ R → cmd + 回车 →输入 python→查询Python版本②操作系统64位,下载amd64;如果是32位,下载32位的。③cp对应自己的Python版本。个人是3.74,下载的是cp37m-win。
3、在Pycharm Terminal终端命令行输入pip install + wordcloud路径例:pip install F:\python\wordcloud-1.8.0-cp37-cp37m-win_amd64.whl
4、查看是否安装成功在这个界面显示wordcloud安装成功!
注意:另一种安装WordCloud方式,从Pycharm中通过在线下载的方式可自行百度。
三、WordCloud基本操作
1、WordCloud展示中文时,出现乱码的解决方案
①cmd → 输入 where python
②Python37\Lib\site-packages\wordcloud文件夹中
准备好simhei.ttf 黑体中文文件,再更改 wordcloud.py文件改为 simhei.tff
2、展示
数据来源于网络
# coding=utf-8from wordcloud import WordCloudimport matplotlib.pyplot as plttemp_list=['花市','举办','交通','地点','方式','时间','档位','黄埔','番禺','花都','南沙','公益','号线','地铁','增城','广场','城南','海珠','文化','鲜花','天河','牌楼','荔湾','展示','盆景','工艺品','路段','产品','品棚','地区','年花','运输','服务','成交额','位居','建设','起来','帮扶','花卉','广州','盆花','粤港澳','插花','出口','物流','项目','看看','服务平台','体育中心','合作','必备','攻略','互联网','大道','优惠','小伙伴','公交','主会场','花棚','分会场','设置','联展','名优产品','销售','经营','花都区','引入','上线','全市','人流量','还有','来自','表演','公园','宣传','特色','举行','知识','西湖','合并','结合','绿道','对口','路过','生态','展位','露天','人民','走过','九龙湖','年货','增添','花城','成果','招标','进行','巡游','棚头','北广场','挥春','休闲','逛逛','摊位','枝花','取消','朋友','提供','免费','湾区','创连','城乡','盆桔','魅力','水族','海珠区','档数','主题','范围','长约','精简','新增','身穿','滨江','错过','继续','开设','芙蓉','大湾','创意','平面','村站','达到','西路','花类','并入','期待','团星','东站','大沙','八站','习俗','为主','去逛','世界','邀请','风云','坪地','演员','成为','荔湾区','氛围','不能','精品','带上','中山','设计图','花卉市场','满足','档口','环场','支持','市二宫','历史','西湖路','教育','中心站','持续时间','体育','策划','街市','体验','没空','组织','回家吧','大楼','解放','规划','心动','滨江路','全区','市桥','从化','街坊','荔新','城东路','感受','称为','花街','亮点']line="\n".join(temp_list)word_cloud=WordCloud(background_color="white",width=1000,height=800,margin=1).generate(line)plt.imshow(word_cloud)plt.axis('off')plt.show()
运行结果如下:
wordcloud()参数可自行百度,根据自己的需要设置
word_cloud=WordCloud( background_color='white', # 设置背景色为空时背景透明色 margin = 1, width = 600, height = 500, # 如果mask非空,则width和height将被忽略 random_state = 40#设置随机数 ).generate(line)
文字云成功运用在案例PPT封面展示中
3、自定义背景
个人经历多次尝试,使用自定义背景时需注意2点要求。
①图片大小要合适。如果图片不合适,不能在文字云中展示。
②数据源数量要充足,否则无法在文字云中展示。
利用网上的图和数据,成功展示自定义背景