各大互联网公司高价抢夺数据人才,为谋求长期发展、获得高薪,很多人转行到了大数据领域。这条路人才虽缺,但要成为优秀大数据工程师并不轻松:别的不说,光学习新技术,巩固旧知识,就需要耗费大量时间精力,实属不易。
为帮助大家提高学习效率,方便日后查找和使用,这里整理了一份大数据开发代码速查表资料,内容包括 Spark、Hadoop 及 Hive 等大数据开发主要知识点。
大数据内存计算框架之
Spark 必知必会
内容包括:Transformation 算子、Action算子。
Spark 必知必会:Transformation 算子
Spark 必知必会:Action算子
大数据分布式文件系统之
Hadoop 必知必会
内容包括:Hadoop Shell ,HDFS 命令有 hadoop fs 和 hdfs dfs 两种风格,都可使用,效果相同。
Hadoop 必知必会:Hadoop Shell
大数据分布式数据库之
Hive 必知必会
内容包括:Hive 内置函数速查表 ,具体有关系、数学及逻辑运算符、数值计算、日期函数、条件函数、字符串函数、聚合函数、高级函数及窗口函数等。
Hive 必知必会:关系运算符
Hive 必知必会:数值计算
Hive 必知必会:字符串函数