Python数据分析项目案例: 电影Top100榜单分析

大纲

内容简介:

对猫眼电影网站的Top100榜单进行数据分析,寻找好电影中隐藏的规律和价值。

源数据:

一份从猫眼电影网站爬取的csv文件。

字段:电影名,主演,上映时间及地区,平均,时长。

记录:100个按评价排序的好电影

部分截图:

Python影评数据分析 python电影数据分析报告_Python


相关工具:

excel、python

分析内容:

分析1: Top100电影地区分布

分析2: Top100电影上映年份分布

分析3: Top100电影风格分布

分析4:铸就经典!谁是好电影保障?

正文

01导入库、整体风格设置=

Python影评数据分析 python电影数据分析报告_python_02


说明:

  1. 导入numpy、和pandas用作数据分析基本库。
  2. 导入matplotlib和seaborn用作可视化。
  3. 最后三行,使中文内容能够友好的展示出来。

02导入数据

  1. pd.read_csv导入数据

2.df.info()得数据不存在缺失值

Python影评数据分析 python电影数据分析报告_Python_03

03数据处理

1.将’上映时间及地区’列 分成 ‘上映年份’和’上映地区’两列

Python影评数据分析 python电影数据分析报告_数据分析_04


2.将’上映地区’列中的’中国香港’改为’中国’,‘法国戛纳’改为’法国’

Python影评数据分析 python电影数据分析报告_数据挖掘_05


3.成功得出需要的格式

Python影评数据分析 python电影数据分析报告_Python影评数据分析_06

04数据分析

分析1: Top100电影地区分布

代码:

Python影评数据分析 python电影数据分析报告_Python影评数据分析_07


可视化:

Python影评数据分析 python电影数据分析报告_数据分析_08


结论:结果估计和大家的预料差不多,虽然此数据是由大多数中国网友投票得出的,但是美国还是几乎包揽了榜单的一半。毕竟美国作为电影制造大国,无论从制作水平,剧情设置,硬件设备等方面都远远领先其他国家,我们熟知的好莱坞也是大片频出。值得一提的是,日本的上榜数竟然有10部电影之多(国内也才16部)看来中国影迷对日本电影还是有不错的评价的。

分析2: Top100电影上映年份分布

代码2.1:

Python影评数据分析 python电影数据分析报告_数据挖掘_09

可视化2.1:

Python影评数据分析 python电影数据分析报告_数据分析_10


代码2.2:

Python影评数据分析 python电影数据分析报告_python_11

可视化2.2:榜单前20

Python影评数据分析 python电影数据分析报告_数据挖掘_12


Python影评数据分析 python电影数据分析报告_数据挖掘_13


结论:

  1. 通过可视化结果2.1得出,从上世纪90年代到现在,榜单中电影分布相对均衡,这与大家经常听到的”这年头烂片横出,好电影越来越少”背道而驰。看来不是好电影越来越少了,而是拍电影的人越来越多了,好片率下降,使人们觉得好片越来越少了。但其实这并不影响每年的那几部好电影的“横空出世”
  2. 通过可视化结果2.2能看出来,虽然前面说了好电影时间上分布还算均衡,但是榜单前19名,却全部都是90年代的电影。看来经典中的经典,还得看90。90年代不愧被称为世界电影史的辉煌。

分析3: Top100电影风格分布

代码:

Python影评数据分析 python电影数据分析报告_数据分析_14


Python影评数据分析 python电影数据分析报告_python_15


可视化结果:

Python影评数据分析 python电影数据分析报告_python_16


结论:

越小众,占比越少(恐怖片,歌舞片),越大众,占比越多(爱情,喜剧)。这个风格分布其实和全部电影(不只是前100)的分布相似。本身基数小的小众风格先天不足,很难在这个榜单中占据多数,而剧情、爱情、喜剧这类老少皆宜,大家都爱看,大家都爱拍的电影基数特别大,能够占据更多的位置是情理之中。

分析4:铸就经典!谁是好电影保障?

代码:在榜单中出现次数超过3次的演员

Python影评数据分析 python电影数据分析报告_Python影评数据分析_17


结果:用了excel展示(比较舒服)

Python影评数据分析 python电影数据分析报告_Python_18


结论:

  1. 哥哥张国荣无敌!Top100榜单中有16个国产电影,这其中竟有7部都有张国荣参演。看来不仅歌唱到了顶峰,连演技也都到达了顶峰。真是让人意料之外,又情理之中。
  2. 系列电影沾了便宜。像大话西游,蝙蝠侠这样的系列电影,一拍几部,同时上榜,似乎比单部电影累计简单许多,余下没有展示出来的多个上榜两部电影的演员也大多数都是依靠系列作品上榜两次的。而这也侧面看出张国荣7部单部累计的恐怖之处。
  3. 共铸经典。细心的人也许会发现这些演员很大比例都是共同参演了同一电影。例如,梁朝伟除了无间道外,其他3部全是和张国荣一起主演。这说明,排在电影顶峰的真正好电影不是一个好演员铸就的,而是众多优秀的演员,还有导演,制片等各方人员一起努力创造出来的。

05结论总结

  1. 美国电影是不可撼动的电影巨头,生产了众多优秀的好电影。
  2. 中国影迷除了美国和国产电影外,对日本、法国电影也有着不错的评价
  3. 好电影没有越来越少,只是拍电影的人越来越多,导致了好片率下降了。只要我们认真挑选,还是有好电影可看的。
  4. 90年代电影经典中的经典。占领top100榜单的前19名。
  5. 电影风格越小众,占比越少,越大众,占比越多,这其中电影基数的多少可能起了决定性的作用。
  6. 张国荣是真正的好电影保障!
  7. 真正好电影不是一个好演员铸就的,而是众多优秀的演员,还有导演,制片等各方人员一起努力创造出来的。