大数据课程大纲 阶段 技术名称 技术内容 第一阶段 linux 系统 章节1:linux 基础 第二阶段 大型网站高并发处理 章节1:高并发与负载均衡 第三阶段 Hadoop 分布式文件系统:HDFS 章节1:Hadoop 简单介绍及架构设计 章节2:Hadoop 高可用集群及java API 第四阶段 Hadoop 分布式计算框架:Mapreduce 章节1:MapReduce 分布式计算框架架构设计及项目案例 第五阶段 Hadoop 离线体系:Hive 章节1:hive 架构设计及集群搭建 章节2:hive 基本操作 章节3:hive 权限管理及优化 第六阶段 Hadoop 离线计算体系:Hbase 章节1:hbase 架构设计及hbase 部署 章节2:hbase 基本操作及性能优化 第七阶段 Zookeeper 开发 章节1:zookeeper 架构及开发 第八阶段 elasticsearch 分布式搜索 章节1:lucene 介绍 章节2:elasticsearch 安装及使用 第九阶段 CDH 集群管理 章节1:CDH 搭建及使用 第十阶段 Storm 实时数据处理 章节1:storm 介绍及部署 章节2:storm 深入学习及案例讲解 第十一阶段 Redis 缓存数据库 章节1:Redis 介绍及使用 第十二阶段 Spark 核心部分:Spark Core 章节1:Spark 介绍及算子使用 章节2:Spark 集群搭建及提交方式 章节3:Spark 核心概念讲解及资源任务调度源码分析 章节4:SparkSQL 介绍及使用 章节5:kafka 的使用及 SparkStreaming 介绍及使用 章节6:Spark 案例实现 第十三阶段 机器学习 章节1:Python 语法介绍及案例实现 章节2:R 语言语法及机器学习算法 第十四阶段 机器学习:推荐系统项目 章节1:推荐系统需求分析及架构分析 章节2:推荐系统案例