要想明确数据分析师的成长之路,不仅要明白数据分析项目的整个流程,更要结合当今时代想要的人才,现将二者之间建立了一定的联系。而数据分析师和科学家一般,都有自己的成长轨迹和阶段,不同的人所处于的阶段不同。
如果你觉得你已经完成了现有阶段所要学习的内容,那么你就可以迈入下一个阶段的学习,现在一起跟着小编来看看这三种不同的阶段吧!
初级水平
什么是初学者?如果解析学和数据科学对你来说是全新的领域,你也不知该行业的发展模式,而你又想在这个行业大展拳脚一番,那么初学者就是你。以下这些应该在你的计划之内。
完整地学习一门课程
数据科学家具有巨大的需求,所以成千上万的课程和研究都在等着你去探索,你可以学习任何你想要的东西。找到学习的材料并不是一件很难的事,但是如果你不为之付出努力的话,学习的过程可能会变得很困难。
你可以参加一个免费的MOOC课程,或者加入一个认证项目,这个项目会让你经历所有的曲折和转变。免费和付费的选择不是问题,主要的目标应该是课程是否能帮你夯实基础,达到一个合适的水平,从可以进一步推进。
当你上一门课的时候,要积极地按照课程的安排、作业和所有的讨论进行。例如,如果你想成为一名机器学习工程师,你可以学习Andrew Ng的机器学习。现在你必须努力学习课程中提供的所有课程材料,当然也包括课程中的作业,这和看视频一样重要。从头到尾完整的学习一门课程,你就能更清楚地了解这一领域。
一些优秀的mooc课程包括:
· Analytics Edge on edX
· Machine Learning rom Andrew NG
选择一个工具/语言并坚持下去
正如我之前提到的,对于你来说,无论你选择哪一个角色,从一而终是很重要的。那么你将要面对一个很难的问题,你应该选择哪种语言/工具?
这可能是初学者最需要问的问题。最直接的答案是选择任何主流工具/语言都可以。毕竟,工具只是实现的手段,理解这一概念更为重要。
不过,问题仍然存在,选择哪一个更好一些呢?网上有各种各样的指南在讨论这个问题。你可以从最简单的语言开始,或者你最熟悉的语言。如果您不精通编程,那么您可能更适合基于GUI的工具。当你掌握了这些概念之后,你就可以着手编写代码了。
中级水平
中级水平的数据科学家是什么样的?如果你已经完成了前一阶段的内容,有过机器学习基础知识的实践经验,掌握了建立预测模型的知识,那你就达到了中级水平。完成这一阶段需要强大的决心和持久的练习。你准备好迎接这个挑战了吗?
机器学习
机器学习最简单的理解就是在一堆杂乱无章的数据中,找到其背后的规律,从这个角度来看,数据分析是机器学习最重要的应用场景之一。虽然学习机器学习需要掌握大量的算法,但是这些算法的难度也并不算高,只要具备一定的数学基础(线性代数、概率论),都是可以顺利理解并运用这些经典算法的。
从机器学习的步骤来看,主要有6大步骤,分别是数据收集、算法设计、算法实现、算法训练、算法验证和算法应用,所以机器学习的前提是数据收集,核心是算法设计。在学习机器学习之前,除了要具有一定的数学基础之外,还需要具有一定的程序设计基础,初学者可以从Python开始学起。
专注集成算法和Boosting算法
集成学习(ensemble learning)从概念上讲,它并不是一个单独的机器学习算法,而是通过构建并结合多个机器学习器来完成学习任务。也就是我们常说的“博采众长”。集成学习可以用于分类问题集成,回归问题集成,特征选取集成,异常点检测集成等等,可以说所有的机器学习领域都可以看到集成学习的身影。
探索Spark、NoSQL和其他大数据工具
今年你的学习之旅始于大数据。考虑到大数据专业人员的需求激增,你一定要学习Spark,这个工具最近非常火爆。大数据的未来就在Spark,它广泛用于处理和操纵数据。除此之外,你还可以拓展到NoSQL和Hadoop领域来。
高级水平
对于进入这个阶段的人我就不需要来给出标准了,你们所了解的数据科学,很多人甚至连尝试的勇气都没有。身处这一阶段,你们的生活惬意而又自如。适时安排一些内容精进自己即可。
好啦,以上就是数据分析师要经历的三个阶段,小伙伴们可以代入自己,看看应该学习哪些内容哦~