Movielens:
教程多,易于上手
更新于2019.12
下载:https://grouplens.org/datasets/movielens/
TMDB 5000 Movie Dataset:
教程也比较多,较易上手
更新于2017-09-28
下载:https://www.kaggle.com/tmdb/tmdb-movie-metadata
Netflix Prize:
教程较少
收集的评论于1999.12.31-2005.12.31
下载:http://dataju.cn/Dataju/web/datasetInstanceDetail/32 (登录就能下)
LDOS-CoMoDa 和 AdomMovie:
这两个数据集比较小,用户数量<100,电影数量<1000
相关的教程较少,但是有许多论文
下载:未知
Large Movie Review Dataset:
包含电影评论及其关联的二进制情绪极性标签
更新于2011(应该是)
下载:http://ai.stanford.edu/~amaas/data/sentiment/ (version 1.0)
http://dataju.cn/Dataju/web/datasetInstanceDetail/98
豆瓣电影数据:
语言为中文,爬取的有评论,可能要进行中文NLP
更新于2017(也有网友自己爬的,最新到2019.3,以下链接为2017更新的)
下载:https://www.kaggle.com/utmhikari/doubanmovieshortcomments/metadata