《流浪地球》豆瓣热门影评词云_java

前言

《流浪地球》豆瓣热门影评词云_java_02


这几天,《流浪地球》这几天可是有三件大喜事,一是票房突破26亿,在中国电影票房排名第七位;二是主演吴京凭借此片成为百亿票房明星;三是登上央视新闻联播。

《流浪地球》上新闻联播,却遭一些人差评,豆瓣网被推上了风尖浪口。

小编爬取了豆瓣热门影评中,所有的评论,大约1600多条,生成词云,让我们更直观的看出在这些影评中大家说的最多的词是什么,从而大概知道大部分人对这部电影的态度是什么。


《流浪地球》豆瓣热门影评词云_java

文件获取

《流浪地球》豆瓣热门影评词云_java_02


关注公众号“木下学Python”,回复关键字“流浪地球热门影评”获取源代码文件


《流浪地球》豆瓣热门影评词云_java

爬虫代码

《流浪地球》豆瓣热门影评词云_java_02


所谓的“巧妇难为无米之炊”,要想生成词云,那当然是获取评论数据咯,小编爬取了热门影评差评的所有评论数据,约有16900多条吧,要是想爬取更多的数据,可以修改代码中的url噢。

小编这是普通爬虫,使用多进程,但是数量大多,用的时间还是有点久,可以修改页数减少时间,但是没有被封ip噢。

代码太长就不贴了,在公众号回复会有代码。


《流浪地球》豆瓣热门影评词云_java

词云制作

《流浪地球》豆瓣热门影评词云_java_02


制作词云,用了 jieba,wordcloud 库,分别是分词库与词云生成库。


《流浪地球》豆瓣热门影评词云_java

效果

《流浪地球》豆瓣热门影评词云_java_02


《流浪地球》豆瓣热门影评词云_java_11


可以看出大部分人还是觉得这部电影是好看的,虽然还是有不少人给了差评,但“萝卜白菜各有所爱”嘛