推荐一些Hadoop家族系列文章,主要介绍Hadoop家族产品,常用的项目包括Hadoop, Hive, Pig, HBase, Sqoop, Mahout, Zookeeper, Avro, Ambari, Chukwa,新增加的项目包括,YARN, Hcatalog, Oozie, Cassandra, Hama, Whirr, Flume, Bigtop, Crunch, Hue等。
一、学习路线图 ● Hadoop家族学习路线图 开篇必读 ● Hive学习路线图 ● Mahout学习路线图 二、编程实践 ● Hadoop历史版本安装 ● 用Maven构建Hadoop项目 ● Hadoop编程调用HDFS ● 用Maven构建Mahout项目 ● Mahout推荐算法API详解 ● 用MapReduce实现矩阵乘法 ● 从源代码剖析Mahout推荐引擎 ● Mahout分步式程序开发 基于物品的协同过滤ItemCF ● Mahout分步式程序开发 聚类Kmeans ● PageRank算法并行实现 三、案例分析 ● 海量Web日志分析 用Hadoop提取KPI统计指标 ● 用Hadoop构建电影推荐系统 ● 用Mahout构建职位推荐引擎 ● Mahout构建图书推荐系统 ● PeopleRank从社交网络中发现个体价值
有道云笔记地址:http://note.youdao.com/noteshare?id=4e6bee3b8162b16072f7f73c50ba341a&sub=3760ED107ECE4080BC54B7BB3A1B3131
















