相信很多同学都想成为数据科学家或者从事相关领域的工作。


六年前,《哈佛商业评论》将数据科学家评为“21世纪最性感的工作”。自那以来,数据科学家已成为美国发展最快的职业之一,毕业生的起薪高达6位数,且供不应求。


数据科学家真的像宣传中的那样了不起吗?_java


那么,如何才能让自己与梦想更加接近?尝试着去了解当下数据科学家身上所具有的特质,不失为一个提升自己的好办法哦。


根据Stack Overflow(关于编程方面的问答网站)所做的“2018年度开发人员调查”的结果,这篇文章试图为大家展示当今数据科学家的全貌,包括他们的性别分化、所具备的技能以及工作满意度等等。  


那么,这些有幸得到Glassdoor(美国一家做企业点评与职位搜索的职场社区)声称的“美国最好工作”的人是谁呢?怎样才能成为他们中的一员?成为一名数据科学家真的像那些宣传中的那样了不起吗?

 

为了探究这些问题的答案,这篇文章使用了Stack Overflow在他们的“2018年度开发者调查”中收集的数据。这个数据集包含来自全世界183个国家和地区的软件开发人员的近10万份回复。

  

在收到的回复中,7088人自称是数据科学家,占总人数的7.7%。文章将这些数据科学家与其余85,010名软件开发人员进行了比较。


数据科学家真的像宣传中的那样了不起吗?_java_02

一个“典型”的数据科学家是什么样的?

 

计算机科学和软件开发历来被认为是由呆板的男性程序员主导的领域,正如HBO上播出的《硅谷》中的情形那样。


数据科学家真的像宣传中的那样了不起吗?_java_03


如今随着数据科学越来越受到关注,这种情形可能会发生转变吗?毕竟这是一份“21世纪最性感的工作”呢。换言之,这个噱头是否足以吸引更加多样化的人群投身计算机和科技行业?答案似乎是否定的。


数据科学家真的像宣传中的那样了不起吗?_java_04

图1:数据科学家(DS)与非数据科学家(Non_DS)在性别(左)和年龄(右)分布上的比较

 

从图1可以看出,数据科学家和非数据科学家受访者的年龄和性别分布基本相同。数据科学家和非数据科学家的平均年龄都是30.5岁。数据科学家中男性占比为91%,非数据科学家中男性占比为92%。

 

这表明,数据科学岗位的增长并没有吸引人口结构中的其他人群到计算机和技术领域,而是为那些无论如何都会成为开发者的人创造了一条新的职业道路。

 

然而,从数据科学家和非数据科学家的教育背景的比较中,我们发现了这两组之间的一个很关键的区别。


数据科学家真的像宣传中的那样了不起吗?_java_05

图2:数据科学家(DS)与非数据科学家(Non_DS)最高学历分布上的比较

 

尽管与主流观念不太一致,但图2表明没有硕士或博士学历的人也可以成为数据科学家。 与非数据科学家相比,数据科学家更有可能拥有更高的学历。45%的数据科学家受访者拥有硕士或博士学历,而非数据科学家中只有23%的人拥有硕士或博士学历。

 

这表明数据科学和非数据科学开发人员所需要的技能有所不同,数据科学家可能更需要从高学位的课程教学中学到的一些技能。


数据科学家真的像宣传中的那样了不起吗?_java_06

数据科学家和非数据科学家之间的编程技能有什么不同?

 

鉴于雇主对数据科学家的学术要求较高,可以提出这样一个问题:与非数据科学家相比,雇主是否也需要数据科学家具有更丰富的编程经验呢?

 

图3表明,实际情况正好相反。


数据科学家真的像宣传中的那样了不起吗?_java_07

图3:数据科学家(DS)与非数据科学家(Non_DS)编程经验分布上的对比

 

数据科学家的编程工作经验普遍比非数据科学家开发人员少,数据科学家受访者中,编程经验为5年及以下的占62%,而在非数据科学家中这一比例为57%。

 

这表明,并不是在各个方面上对数据科学家都要提出更高的要求。对于开发人员而言,在编程技能与从大学课程中学到的其他技能之间存在着一种平衡调节。

 

然而,并不是所有的编程语言都是相同的,编程语言数据科学家和非数据科学家在日常工作中使用的编程语言不一定相同。

 

数据科学家更可能使用为统计建模和分析,或与库一起使用而设计的语言,如Python或R语言。而非数据科学家更可能使用与web开发活动(如HTML、CSS和JavaScript)相关的语言进行编程。

 

例如,在过去一年中,77%的数据科学家的报告中使用了Python编程,而只有35%的非数据科学家使用了Python编程。同时,非数据科学家的报告中使用JavaScript编程的占72%,而数据科学家使用Java Script的只有55%。

 

这反映了数据科学家与非数据科学家通常执行的任务类型是不同的。数据科学家通常专注于使用统计和建模技术从数据中获得一些启发,而非数据科学家则更可能参与软件工程或web开发类型的活动。


数据科学家真的像宣传中的那样了不起吗?_java_08 数据科学家是否比非数据科学家更满意他们的职业?

 

如果数据科学家真的是目前最好的工作,那么可以预想,数据科学家应该要比非数据科学家对自己的工作和事业在总体上更为满意。这也正是数据中反映出来的。

 

然而,尽管数据科学家确实倾向于比非数据科学家更满意自己的工作和事业,但数据科学家和非数据科学家在他们的工作和事业上都有很高的满意度。

 

图4显示73%的数据科学家和70%的非数据科学家对他们的工作感到满意,74%的数据科学家和73%的非数据科学家对他们的事业感到满意。


数据科学家真的像宣传中的那样了不起吗?_java_09

图4:数据科学家(DS)与非数据科学家(Non_DS)的工作满意度(左)和事业满意度(右)分布的比较


由此可见,即使你不适合从事数据科学方面的工作,任何与开发相关的职位都可能带来与“美国最好工作”类似的工作和事业满意度。


数据科学家真的像宣传中的那样了不起吗?_java_10

总结


在探索了怎样获得数据科学家的工作、数据科学家与非数据科学家开发人员有何不同,以及比较了这两组人群的工作和事业满意度之后,可以发现:

 

  1. 尽管数据科学家和非数据科学家往往来自类似的人口背景(主要是年轻男性),但与非数据科学家相比,数据科学家更有可能拥有更高的学历,不过他们的编程经验往往没有非数据科学家丰富。


  2. 数据科学家更倾向于使用以统计和建模为中心的编程语言,如Python和R语言,而非数据科学家更倾向于使用web开发为中心的语言,如HTML、CSS和JavaScript。


  3. 尽管数据科学家对自己的工作和事业满意度比非数据科学家高,但这两者都对自己的工作和事业满意度都很高。

 

将以上结果结合起来,一个典型的数据科学家的形象似乎是这样的:呆板的男程序员、30出头、拥有高学历和一些有关编程语言(比如Python或R)的工作经验。

 

然而,现在的“典型的”数据科学家的样子并不意味着他们将来也会是这样。事实上,为了适应全球经济,这种形象将不得不作出改变。

 

正如前面提到的,数据科学是一个快速增长的职业,其需求一直超过供应,并有望在未来几年持续下去。要满足这种需求,最好的办法是让雇主寻找方法,吸引传统上在计算机科学和技术领域并不具有代表性的人口结构群体加入这个行业。


数据科学家真的像宣传中的那样了不起吗?_java_11


因此,如果你认为自己不像是一个“典型的”数据科学家,不要气馁。

 

在数据科学领域,各种背景的人都有很大的施展空间。从数据科学家对自己的工作和事业的满意度水平来看,为获得一个数据科学职位而去发展相关技能的努力是非常值得肯定的。毕竟,谁不想从事“21世纪最性感的工作”呢?


数据科学家真的像宣传中的那样了不起吗?_java_12

留言 点赞 发个朋友圈

我们一起分享AI学习与发展的干货


编译组:狄思云、韦振琛

相关链接:

https://www.kdnuggets.com/2018/11/data-scientist-look-like.html


如需转载,请后台留言,遵守转载规范


推荐文章阅读


EMNLP2017论文集28篇论文解读

2018年AI三大顶会中国学术成果全链接

ACL2017 论文集:34篇解读干货全在这里

10篇AAAI2017经典论文回顾


长按识别二维码可添加关注

读芯君爱你


数据科学家真的像宣传中的那样了不起吗?_java_13