全文链接如今数据科学书籍、认证和文凭,如雨后春笋般层出不穷。但许多仅仅是镜花水月:许多人钻了这一新名词的空子,将旧酒(比如统计学和R编程)放在了“数据科学”这个新瓶里。本文选自《数据天才:数据科学家修炼之道》。R语言编程跟伪数据科学为何扯上了关系? R是一种有20多年历史的开源统计编程语言及编译环境,是商业化产品S+的后继者。R一直以来都局限于内存数据处理,在统计圈子里非常流行,并因其出色的可视
转载
2017-06-07 15:08:18
703阅读
"数据科学"(DataScience)起初叫"datalogy "。最初在1966年由Peter Naur提出,用来代替"计算机科学"(丹麦人,2005年图灵奖得主,丹麦的计算机学会的正式名称就叫Danish Society of Datalogy,他是这个学会的第一任主席。Algol 60是许多后
转载
2019-04-08 06:57:00
558阅读
2评论
SQL是一种编程语言,大多数关系数据库管理系统(RDBMS)都使用它来管理以表格形式(即表)存储的数据。SQL是数据科学家所期望的一项基本技能。你可能会说,这是一个数据工程师的工作,但数据科学家的角色往往是全套的。此外,作为一名数据科学家,你不希望依赖数据工程师从数据库中检索数据。在本文中,我们将编写复杂的查询来检索存储在表中的数据。我已经将客户流失数据集(https://www.kaggle.c
转载
2021-05-24 16:11:29
305阅读
2评论
用一句话总结「数据科学家」的定义:运用统计分析、机器学习、分布式处理等技术,从大量数据中提取出对业务有意
原创
2023-04-19 14:16:33
348阅读
最近听到一个很高大上的职位叫做“数据科学家”,这个职位中的“数据”和“科学家”两个关键词一个比一个厉害,我们当前处于“数据”时代,而“科学家”则是从小进学校就崇拜的一个职业。那数据科学是什么,数据科学家这个职业做些什么事情?本文给大家分享下我的总结。什么是数据科学来自维基百科:数据科学(英语:data science)是一门利用数据学习知识的学科,其目标是通过从数据中提取出有价值的部分来生产数据产
原创
2020-12-30 16:45:24
1342阅读
原文链接:http://blogs.sap.com/innovation/big-data/big-data-job-alert-the-data-scientist-020253
作者:Jen Cohen Crompton,发表于2012年10月29日
随着大数据的兴起以及收集和管理海量信息技术的进步,我们发现在大数据的分析与应用方面仍然存在着一定的差距。
翻译
精选
2013-01-15 11:14:14
700阅读
数据的处理平台的搭建:包括公司的基础数据平台以及各个具体业务线的指标数据和日志数据平台。此步的设计和技术选型严重依赖于后两步的分析需求。历史数据的分析挖掘:包括跟各种产品线相关的业务分析,用户画像,用户行为分析,用户留存分析等等。类似的分析可以以图标或其他可视化的方式展现,目的是让业务决策者对于现状有清晰、系统、完整的认识,从而辅助其做出下一步的动作(action)。数据驱动的预测性分析:比如建立
转载
2023-10-09 15:55:26
56阅读
SQL是成为数据科学家的必要条件吗?答案是肯定的。数据科学已经发展了,虽然许多数据科学家仍然使用CSV文件(值以逗号分隔的文本存储库提供所需的支持和敏捷性...
原创
2023-05-07 00:43:12
219阅读
SQL是成为数据科学家的必要条件吗?答案是肯定的。数据科学已经发展了,虽然许多数据科学家仍然使用CSV文件(值以逗号分隔的文本文件),但它们不是最好的选择。Python Panda库允许从CSV文件加载数据,但是这些文件有许多约束。例如,它们通常不连接到数据库,这就要求您在每次数据时生成一个新的CSV文件提取。在大数据时代,这是完全不切实际的。关系数据库为使用大数据存...
原创
2022-08-09 18:01:06
344阅读
人工智能现在可以驱动所谓的要素工程(Feature Engineering),允许用户自动发现和创建数据科学处理功能。这种做法开启了一种全新的数据科学方法,似乎会威胁到数据科学家的作用。在过去几年里,AutoML快速增长。而且目前看来,经济衰退无可避免,人工智能(AI)和机器学习自动化开发的观念也必将越来越有吸引力。业界现在推出的各种新平台(https://dotdata.com)都具有更多的自
转载
2020-04-13 15:10:00
109阅读
2评论
中新网北京8月22日电(记者 王诗尧)初次见到唐立梅时,她与大众印象里的“科学家”形象不太相符。酒店的靠窗沙发上摆满了化妆品,唐立梅正安静地坐在椅子上配合着化妆师上妆。
乍一看这个场景似乎是哪位“女明星”在做上台前准备,实际上采访结束后的唐立梅真的“登台”参加了一场青年分享大会。
上一个十年里,首位兼具大洋深潜与南极科考经历的中国女科学家,是唐立梅身上显著的标签。总有人说,女生
数据科学家如何找到心仪的工作?编程派微信号:codingpy本文是「打造数据科学的作品集」的第四篇,全文大约 9800 字,读完大约需要 17 分钟。如果你喜欢并希望及时获取本系列的最新文章,可以订阅我们。作者:Vik Paruchuri,译者:赵喧典,校对:EarlGrey,出品:PythonTG 翻译组/编程派在本系列中,我们已经讨论了如何用数据讲故事,如何打造一个完整的机器学习项目,以及如何
原创
2020-12-23 20:52:50
346阅读
作者 | Kurtis Pykes译者 | Sambodhi策划 | 李冬梅本文最初发表在 Towards Data Science 博客,经原作者 Kurtis Pykes 授权,InfoQ 中文站翻译并分享。很多人会问这样的问题:没有学位,我就当不了数据科学家吗?在我看来,这个问题的简单答案是:No! 在数据领域工作的人有很多,但却没有学历证书来证明他们的角色……我就是其中之一。但有趣的是,随
原创
2021-03-27 13:03:04
198阅读