好了,读者朋友们。周末的时候我发了一篇《我的缅甸往事(一)》,无数读者惊呼是不是关注错人了????。
这里解释一下,《我的缅甸往事》中的经历是我读书的时候的一段往事,真实发生的事情。我会在周末的时候连载。周末大家就不要卷了,好好看会小说也是不错的。
言归正传。
我在很早之前写过一篇文章《八千里路云和月|从零到大数据专家学习路径指南》
这篇文章中,我给出了详细的大数据领域的学习路线,并且配合Github上的《大数据成神之路》,基本锁定了一个专家级别的数据开发需要具备的能力模型。
OK,重点来了。有没有视频资源可以配合他们一起呢?答案当然是有的,这里我总结了B站上讲的非常不错的资源推荐给大家。
基础篇
语言基础篇
关于编程语言这部分,大部分同学都是Java附带Scala技能加点,当然如果你学了一点Python的东西也是一个加分项。
那么关于Java语言你可以参考下面这个视频,尤其是如果你的语言基础极差,都没有用过Java语言。
如果你有一定的语言基础,想看看自己掌握到了什么程度?OK,下面这个视频就满足你的胃口了。这个视频从关键字到新特性,带着问题的形式,边学边考。
数据结构篇
如果你还在读书,结合课本来看,我推荐这个:
浙江大学老师的这个视频可以说是公开课的牌面了,可以称为数据结构篇的「正规军」了。
与之对应的是,下面这个视频。如果你工作有一段时间了,那么可以直接看这个视频:
小甲鱼简直可以称为良心UP主的楷模。小甲鱼的视频语言风趣幽默,举了很多的例子配合知识点。
Linux基础
Linux基础这块对于数据开发非常重要,因为大家平时接触过的数据框架的搭建过程涉及大量的Linux命令操作,并且在系统级别的调优还会接触atime、ulimit这种比较高级的命令。
这里我推荐史上最牛的Linux视频教程:
如果这个视频满足不了你,你还可以参考:
数据库入门
基于MySQL了解常见的SQL语法,大数据领域SQL化是未来的发展方向。
以及下面这个:
计算机基础
操作系统
这里B站是万能的,但是我还给出了一些其他的链接:
操作系统
数据结构与算法
计算机网络
哈工大版本
计算机组成原理
哈工大计算机组成原理
上:https://www.icourse163.org/course/hit-309001#/info
下:https://www.icourse163.org/course/hit-1001527001#/info
分布式理论
关于这一块内容,我没有在B站找到资源可以直接看。这块内容因为都是一些比较高深的论文,我相信很少有老师能够通俗易懂的讲给大家,这块就全靠大家搜集资源了。我给出了学习大纲:
- 分布式中的一些基本概念:集群(Cluster)、负载均衡(Load Balancer)等
- 分布式系统理论基础:一致性、2PC 和 3PC
- 分布式系统理论基础:CAP
- 分布式系统理论基础:时间、时钟和事件顺序
- 分布式系统理论进阶:Paxos
- 分布式系统理论进阶:Raft、Zab
- 分布式系统理论进阶:选举、多数派和租约
- 分布式锁的解决方案
- 分布式事务的解决方案
- 分布式 ID 生成器解决方案
Netty与网络通信
我只找到了这个,我挑了几章我自己研究过的看,总体来说讲到点子上了。
框架篇
这部分就到了真正考验各个老师的水平阶段了。
离线部分必看的几个视频:
Hadoop
当时看到3.x这个视频的时候,无哥我是虎躯一震。这也太强了,Hadoop3.x才出多久,这网上视频都有了?
Hive
Hive也是,这特么3.x版本才出来没多久。在下实在也是震惊了????。关键这课的质量还挺好。????
如果上面的入门课程满足不了你,下面的这个进阶课相信可以填满你了。
Hbase
如果你是一个初学者,那么可以看这个:
那么如果你是一个资深的开发,需要系统的学习或者查漏补缺,视频就满足不了大家了。这里我推荐一本书,这本书是关于Hbase目前市面上最新,最前言的书了。作者是Apache Hbase的PMC成员,如果你混迹过apche的圈子,对这两位大佬应该不陌生。
《HBase原理与实践》, 作者: 胡争、范欣欣
Kafka
你可以参考这个视频:
Kafka这个框架更新也非常频繁,至今已经到了3.x版本了,并且引入了很多新的特性。目前还没有看到跟最新版本有关的视频出现。
如果你的时间有限,可以看这个:
Spark
这个名字取得很大,但是当成一个入门课还是不错的。
同样大家也知道,Spark3.x版本的更新也带来了一波巨大的改变。
就问你强不强!
Flink
再次给清华大佬跪下了。Flink的这个视频我在群里跟很多小伙伴推荐过了。
此视频一出,B站吃瓜群众惊呼:武老师,发生甚么事了?!
清华大佬不满足于此,竟然给Flink SQL出了单独的视频!