Movielens:

教程多,易于上手

更新于2019.12

下载:​​https://grouplens.org/datasets/movielens/​

 

TMDB 5000 Movie Dataset:

       教程也比较多,较易上手

       更新于2017-09-28

下载:​​https://www.kaggle.com/tmdb/tmdb-movie-metadata​

 

Netflix Prize:

       教程较少

收集的评论于1999.12.31-2005.12.31

下载:​​http://dataju.cn/Dataju/web/datasetInstanceDetail/32​​  (登录就能下)

 

LDOS-CoMoDa 和 AdomMovie:

       这两个数据集比较小,用户数量<100,电影数量<1000

       相关的教程较少,但是有许多论文

       下载:未知

 

Large Movie Review Dataset:

       包含电影评论及其关联的二进制情绪极性标签

更新于2011(应该是)

下载:​​http://ai.stanford.edu/~amaas/data/sentiment/​​  (version 1.0)

​http://dataju.cn/Dataju/web/datasetInstanceDetail/98​

 

豆瓣电影数据:

       语言为中文,爬取的有评论,可能要进行中文NLP

       更新于2017(也有网友自己爬的,最新到2019.3,以下链接为2017更新的)

       下载:​​https://www.kaggle.com/utmhikari/doubanmovieshortcomments/metadata​