今天给大家介绍一位在上海某数据智能公司担任大数据开发工程师的朋友,菌哥。
菌哥热衷于开源分享,为小伙伴们带来了如下福利:
Hadoop全家桶
Hadoop在广义上指一个生态圈,泛指大数据技术相关的开源组件或产品,通过这张思维导图,你可以对大数据生态圈常用组件有一定的了解和使用。
打开任意一个分支,可以发现都是重点干货!
Spark
Spark是基于内存的,用于大规模数据处理(离线计算、实时计算、快速查询(交互式查询))的统一分析引擎。通过这张思维导图,你可以掌握绝大部分Spark的要点精髓。
Kafka
Kafka是一种高吞吐量的分布式发布订阅消息系统,在Java后端和大数据实时开发中都经常能看见它的身影。
Scala
Scala 是一门多范式的编程语言,跟Java一样是运行在JVM之上的。同时Spark也是用Scala写的,为了能看懂源码,学习Scala势在必行!
大数据全套视频
尤其是不知道该如何入门大数据,需要学哪些内容的朋友,下面这套大数据视频一定会对你有所帮助。