在美国,有这么几个和豆瓣类似,主流网民经常访问的与电影有关的网站:专业存储电影信息兼职打分的IMDb(Internet Movie Database互联网电影数据库)、创立快二十年几经易手的烂番茄(Rotten Tomatoes)、专业网络购票副业打分的“美国猫眼”Fandango,以及专门聚合书籍和视听出版产品批评意见的Metacritic。

随着互联网和社交网站的快速普及,这几个网站也形成了独特的电影打分机制,虽然各不相同,但还都挺受电影市场片方、观众和专业批评人士的信任。这也让它们在国内甚至国际上成为了具有公信力的电影评分网站。

目录

IMDb

Metacritic

烂番茄(Rotten Tomatoes)

Fandango


IMDb

IMDB网站是目前互联网上最为权威、系统、全面的电影资料网站,里面包括了几乎所有的电影,以及1982 年以后的电视剧集。IMDB的资料中包括了影片的众多信息,演员,片长,内容介绍,分级 ,评论等,就个人买碟而言,很大程度上也是参考IMDB的得分。 它所特有的电影评分系统深受影迷的欢迎,注册的用户可以给任何一部影片打分并加以评述,而网站又会根据影片所得平均分、选票的数目等计算得出影片的加权平均分并以此进行TOP250(最佳250部影片)和Bottom100(最差100部影片)的排行。

根据IMDB网站上公布的TOP250评分标准,它所使用的是贝叶斯统计算法得出的加权分(Weighted Rank-WR),公式如下:

电影评分数据分析论文 电影评分体系_算法

  • R = average for the movie (mean) = (Rating) (是用普通的方法计算出这部电影的平均分
  • v = number of votes for the movie = (votes) (投票人数,需要注意的是,只有经常投票者才会被计算在内)
  • m = minimum votes required to be listed in the top 250 (currently 1250) (进入imdb top 250需要的最小票数,只有三两个人投票的电影就算得满分也没用的)
  • C = the mean vote across the whole report (currently 6.9) (目前所有电影的平均得分

仔细研究这个公式会发现,IMDB为每部电影增加了1250张选票,并且这些选票的评分都为6.9。这样做的原因是,假设所有电影都至少有1250张选票,那么就都具备了进入前250名的评选条件;然后假设这1250张选票的评分是所有电影的平均得分(即假设这部电影具有平均水准);最后,用现有的观众投票进行修正,长期来看,v/(v+m)这部分的权重将越来越大,得分将慢慢接近真实情况。这样做拉近了不同电影之间投票人数的差异,使得投票人数较少的电影也有可能排名前列。

但需要明确的是,这个公式只是IMDb维护Top 250电影榜单所使用的,并不是每一部新电影打分都采用这个方法。平常,IMDb的用户可以用1-10颗星来为一部电影打分,最后IMDb会计算出一个加权平均星数作为得分。

电影评分数据分析论文 电影评分体系_评分_02

为了维护评分的公正,日常评分的计算公式仍然是个不能公开的秘密。已知的是,结果依然是加权分,采用了算术平均数(Arithmetic mean)的计算方法,但由于算数平均数容易受到极端数据的影响,IMDb也设计了一些过滤机制。 

电影评分数据分析论文 电影评分体系_推荐系统_03

可以看到IMDB上的评分完全来自于网民的评价,凭的是参与评价的网民的自身喜好,参与评分的网民越多,IMDB的评分越有可靠性。

Metacritic

Metacritic是一个出版物专业批评聚合网站,成立于1999年。最早从书评起家,现在的Metacritic的批评对象已经涵盖了音乐专辑、电影、电视剧、电子游戏等视听出版物。注意,重点在于“专业”二字。

要体现专业,首先,Metacritic为电影打出的Metascore是从主流媒体和专业影评机构的影评人那里聚合而来的,这是它和IMDb评分最主要的不同。这些影评人和他们供职的机构,大多在影评方面具有公信力,比如《卫报》、《纽约时报》、《滚石》、《好莱坞记者》,《时代周刊》和NPR等这样的大报和电台,都是能参与Metascore计算的专业影评来源。

但不是每个机构和影评人都会自己给出一个准确的分数。实际上Metacritic是这样做的:来源有分数就用来源分数;来源有星数就大概换算成百分制的分数;如果来源的影评只有文字没有评分,他们就自己找人去阅读影评,然后根据读完的感受自己给一个分,然后再用这个分拿去计算。

电影评分数据分析论文 电影评分体系_电影评分数据分析论文_04

 

虽然这样计算出的Metascore,看上去不是特别能够准确和真实地体现批评家的感受,但至少这十几年过来Metacritic没怎么被质疑过。尽管如此,Metacritic在Metascore之外也还是设立了一个Userscore——不会展现在一部电影的页面上,但用户投票的工具会直接放在Metascore的下方,给用户一种投了票就能影响得分的错觉。

电影评分数据分析论文 电影评分体系_电影评分数据分析论文_05

 

烂番茄(Rotten Tomatoes)

烂番茄创立于1998年,一直致力于提供具有公信力的电影打分。其创始人帕特里克·李曾经在Pingwest品玩的SYNC 2016科技大会上介绍过烂番茄的极盛时的风光和设立的机制。这么来看,烂番茄也算是影评界的不老松。

烂番茄没有评分!必须明确烂番茄采用的评价系统叫做Tomatometer,一般翻译成“新鲜度”。一部电影的新鲜度,同样是由专业的影评意见所决定的。在烂番茄上影评人不打分,也不给星,只能给出Fresh(一个新鲜番茄)和Rotten(一个烂番茄)两种标记,分别代表推荐和不推荐。

电影评分数据分析论文 电影评分体系_评分_06

如果超过60%的影评人推荐一部电影,电影的新鲜度就会整体为Fresh,旁边有一个百分比显示新鲜度,也即具体多大比例的影评人推荐;如果超过75%的影评人推荐,新鲜度就会变成“Certified Fresh”;但如果给Fresh的影评人低于60%,电影就只能得到那一坨绿色的烂番茄了。

和Metacritic一样,烂番茄也需要确保用户的意见能够得到体现,于是又设定了一个Audience Score(观众分数)。这个观众分数采集来源是观众打星,但最后体现出来的所有打出3星半以上的用户比例。

电影评分数据分析论文 电影评分体系_电影排序_07

用打好评的影评人/用户占总影评人/用户人数的比例,而不是一个简单的数值来评价一部电影,是烂番茄和其他影评网站在本质上的最大区别。它突出的是人群对一部电影持有的主流观点,而不是用一个无法让每个评价者都感同身受的数值。

Fandango

2000年成立的Fandango(原名Tickemaker),可以被理解为美国版猫眼。它慢慢统一了美国混乱的网络票务市场,现在最主要的功能就是网上买电影票,查座位情况,以及查看影评等等。

Fandango对粉丝、用户的地位和意见非常重视,在影评机制上得到了体现。Fandango的电影评价完全采用粉丝打分作为依据。

电影评分数据分析论文 电影评分体系_算法_08

Fandango的评分计算方式看上去并不复杂,应该没有什么加权和过滤机制。这也导致了该网站上3星以下电影的数量比烂番茄、Metacritic和IMDb要少得多。幸好Fandango加上了比较专业和严苛的烂番茄新鲜度,以及专业的家庭电影评价机构意见(上图右上角),来中和什么烂片都能咽得下去的粉丝打分。 

总的来说,

  • IMDb以用户打分为基础,使用过滤规则和加权算法来平衡分数;
  • Metacritic则主要考虑影评人的意见,专业度较高;
  • 烂番茄分别考虑了用户打分和影评人打分,都是以百分比好评的方式展现影片口碑;
  • Fandango的原理最简单,完全依靠用户的打分。