如今,大多数公司都意识到数据驱动的商业策略的价值,因此需要有数据分析才能的人来洞察不断收集的信息。随着我们继续将现实世界数字化,对分析师的需求只会增加。 可以了解之前讲解的《​数据分析为什么火了​

如果你刚开始学习数据分析,那么怎么入门呢?其实各大招聘网站的数据分析职位就是一个很好的参考。那么数据分析师究竟需要哪些技能呢?

数据分析必备技能:

  • Excel
  • SQL
  • Python或者R
  • 数据可视化
  • 机器学习
  • PPT
  • 逻辑思维

下面我们一个个看下

一、Excel

说到Excel,首先想到的可能是电子表格,但是这个工具背后有更多的分析能力,如编写宏和使用VBA查找,这样的高级Excel方法在处理小数据量时更轻松、快速的分析。比如散点图可以很方便的帮助我们发现数据分布特征,Excel甚至可以做线性回归。因为Excel受数据量的影响,所以学习一门数据处理语言是非常有必要的。

二、SQL

SQL是普遍存在的行业标准数据库语言,是数据分析师需要掌握的最重要的技能。这种语言通常被认为是Excel的“终极”版本,它能够处理Excel无法处理的大型数据集。

几乎每个数据分析组织都至少需要一个了解sql的人,更需要一个数据仓库团队。以前很多行业的业务逻辑全写在数据库存储过程中,那时候,只会写SQL就可以拿高薪。现在很多大数据计算引擎也都支持了SQL操作,所以你想使用大数据,那么学习SQL是第一步。

三、Python或者R

任何Excel能做的事情,R或Python都能做得更好,甚至要快10倍。和SQL一样,R和Python可以处理Excel不能处理大数据量的事情。它们是强大的统计编程语言,用于对大数据集执行高级分析和预测分析。要成为一名真正的数据分析师,您需要超越SQL并至少掌握其中一种语言。

那么你应该学习哪一个呢?R和Python都是开源和免费的,公司招聘一般也是写明,会其中一个就可以。但是,由于Python现在有很多工具包,而且机器学习和深度学习也都和Python联系紧密,所以推荐大家优先学习Python。

四、数据可视化

为什么要掌握可视化,举个例子。

如何入门数据分析?_数据分析

你在买水果的时候肯定关系水果是不是坏的,你一看就知道,数据也一样,你可以通过可视化很快的发现异常数据、脏数据。

同样,厨师们除了要保证菜好吃,还要把菜做的好看,这样客人们才会更加满意,原因买单。数据分析的内容再好,最后都要可视化出来,让老板能看懂,这样才能升值加薪啊!

可见,可视化能够用数据讲述一个引人注目的故事,让你的观点更易被人理解。分析师使用吸引眼球的、高质量的图表和图形,以清晰简洁的方式展示分析的发现。所以,去学习Python的Matplotlib和Seaborn吧,可以参考之前的文章讲解《​​数据挖掘从入门到放弃(五)seaborn 的数据可视化​​》。

五、机器学习

现在AI和预测分析是数据科学领域最热门的两个主题,数据分析师不只是单单对历史数据的统计操作了,对机器学习的理解已被确定为分析师的工作之一。虽然并不是每个分析师都使用机器学习,但是为了在这个领域要走的更远,学习机器学习是很重要的。然而机器学习需要一定的统计学知识,需要理解算法的原理,然后才能更好的使用。可以参考文章结尾的历史文章精选。

六、PPT

如何入门数据分析?_数据分析_02

数据可视化和PPT是相辅相成的。但是我们每个人基本都是程序员出身,不屑于写PPT。但是你不能拿着代码给老板汇报吧。PPT可以很好帮助你表达清楚自己的分析思路和分析结论,也帮让老板理解。但是PPT并不是直接把word粘贴过来,PPT最主要的是图,字不用太多,因为PPT是用来讲解的,不是需求文档!

关于PPT,还是要多谢,写的多了,被老板批评的多了,自然就会了……

如何入门数据分析?_数据分析_03

七、逻辑思维能力

使用数据来找到问题的答案,意味着首先你要弄清楚要什么,也就是用户故事要想好。数据分析师的角色是发现并关联那些并不总是很清晰的联系。这个比以上6条都难,我遇到过有些分析师用机器学习或者深度学习跑出一些结果,最后告诉老板,结果是模型学习的,是不可解释的。我承认,比如神经网络跑出来的结果,很难解释。但是我们是数据分析师,不是算法工程师,我们首先要考虑的就是分析结果和我们之前的用户故事有什么联系,我们要找到这部分联系,解释给老板。那么如何来培养这种能力呢?比如问自己最初的用户故事是什么,怎么来的,联系当前的业务知识,看看结果和分析需求的哪个节点能联系起来,是否能够使用起初的用户故事。经常这样思考,可以帮助你在寻找解决方案时保持清醒,而不是被一个很难解释搞蒙。

结尾

如果你想进入数据分析这个行业,那么就从上述7个技能开始吧。

关注本公众号,回复【数据分析】,获取相关学习资料。

如何入门数据分析?_数据分析_04