之前有给大家推荐过如何从小白称为专业数据分析师的一份完整书单(没看过的可以自取《如何快速入门并成为厉害的数据分析师,一份完整书单》)。
但是对于很多懒癌晚期的小伙伴来说,并不满足于此啊,光看书怎么行。事实上并不是看书不好,而是很多小朋友看不进去啊。所以今天给大家整理了一份Coursera上数据科学的课程,深入浅出的,而且全部免费。
你会因为这些课程给你开阔的视野和深刻的认知而相见恨晚。
一、大数据认知
Introduction to Big Data
加州大学
https://www.coursera.org/learn/big-data-introduction
可以说是小白认识大数据最好的一门课了,当然前提是你有兴趣了解什么是大数据?大数据时代为什么会到来?该课程会为你系统地阐述大数据的核心概念和时代意义。并且给你提供这样一种思维:如何在你的当下的工作和未来的规划中使用大数据,如何利用数据分析让工作变得高效和更有意义。
Data Scientist’s Toolbox
约翰霍普金斯大学
https://www.coursera.org/learn/data-scientists-tools
经典的基础课程,当然同样适合小白玩家。该课程概述了数据分析和数据科学家的“工具箱”里所用到的基本工具、需要处理的数据和要解决的问题。本课程有两个组成部分。第一个是将数据转化为可操作的知识的概念介绍。二是工具,将程序中使用类似的版本控制和程序语言方面的知识如:Git,GitHub,R,和 RStudio。
二、编程语言
An Introduction to Interactive Programming in Python (Part 1)
莱斯大学
https://www.coursera.org/learn/interactive-python-1
这个课程的目的是帮助没有计算机背景或者专业基础薄弱的学生建立简单的交互应用,当然也是python的入门课程。python本身是一门比较简单的语言,当然这个课程也让学习变得更加简单而富有乐趣。认真学完该课程一般来说写一些简单的交互程序没有多大的问题,但是要深入还要继续学习,推荐一个自学Python的网站codecademy.com。
用 Python 玩转数据
南京大学
https://www.coursera.org/learn/hipython
在coursera上看到国内高校的课总有种亲切感。课程主要面向非计算机专业学生,从Python基本语法开始,到Python中如何从本地和网络上进行数据获取,如何表示数据,再到如何对数据进行基础和高级的统计分析及可视化,到最后如何设计一个简单的GUI界面来表示和处理数据,层层推进。
R Programing
约翰霍普金斯大学
https://www.coursera.org/learn/r-programming
同样是适合小白入门的R课程,约翰霍普金斯大学可谓是coursera上的高产院校。你能学习到最基本的编程环境配置,编程语言的概念,还包括在统计计算中R的实际应用问题。其中包括在R编程,读取数据到R,访问R包,写R的功能,调试,分析R代码,组织和注释R代码等。在统计数据分析实践中还提供了实际工作的例子,提升你解决问题的能力。
三、数据分析
数据驱动型公司的业务指标
杜克大学
https://www.coursera.org/learn/analytics-business-metrics
这将是使用数据分析使公司更好的盈利且更具竞争力的最佳实践。 如何识别最关键的业务指标,并将其与单纯的数据区分开来,这就是业务数据分析师通畅会扮演的重要角色。 通过这个课程你会了解像数据挖掘工程师这样高需求的职位被聘请所需要的技能。正如像Amazon、Uber、Airbnb等企业正在通过创造性地利用大数据颠覆整个行业,为何这些公司如此具有破坏性?他们如何使用数据分析方法超越传统公司的?你都可以在这里找到答案。
数据分析工具
卫斯理安大学
https://www.coursera.org/learn/data-analysis-tools
在这个课程中,你可以开发和测试有关数据的假设。还可以学习各种统计测试,以及如何应用适当的统计模型到特定的数据和问题中的策略。课程中会用到两个强大的统计软件包的选择(SAS或Python),涉及到方差分析、卡方检验、皮尔森相关性分析。简而言之就是指导你通过基本的统计原则,结合相关的工具来解决实际的问题。
Mastering Data Analysis in Excel
杜克大学
https://www.coursera.org/learn/analytics-excel/
学习如何去解决实际中的问题时学习Excel的一个非常好的方式。课程中在Excel中使用特定的工具来建立一些有用的东西,你可以学会更多你平时没有用到但确实有效的Excel功能。通过特有的的数据去分析产品,这当然需要你理解和使用比较先进的信息理论方法–贝叶斯逻辑数据分析在商业实践中的应用。当然学习这门课程并不需要任何微积分和矩阵代数,或任何知识或R或MATLAB软件编程等知识。
使用机器学习进行数据分析
卫斯理安大学
https://www.coursera.org/learn/machine-learning-data-analysis
哈哈,这门课程时帮助你预测未来的。严格地说,是通过大量的数据和科学的分析方法来对未来的可能性进行预测。机器学习是开发、测试和应用预测算法来实现这一目标的过程。这门课程介绍了整体监督机器学习的概念、技术和算法。在机器学习中,从基本分类到决策树和聚类,你可以学会如何应用机器学习算法作为解决你的研究问题的替代方法。
商业智能的概念、工具与应用
科罗拉多大学
https://www.coursera.org/learn/business-intelligence-tools
本课程概述了商业智能技术是如何支持在不同商业领域的决策制定,这些技术已经在公司战略、绩效管理和竞争意识等方面产生了巨大的影响,包括了广泛采用的决策支持系统、商业智能系统和可视化分析技术。通过本课程,你能学习到作为一个BI工程师应该具备的知识和技能,例如使用数据仓库实现商业智能的目标,你将有机会在数据仓库环境下使用大规模数据,还会用MicroStrategy的在线分析(OLAP)和数据可视化功能来创建可视化的管理面板。
四、数据可视化
使用 Tableau 展示可视化数据
杜克大学
https://www.coursera.org/learn/analytics-tableau
要让绝大部分不懂技术的人看懂数据分析结果,进行有效的沟通,数据可视化的重要程度不容忽视。Tableau作为时下最流行的商业可视化工具,让你可以更加简单而高效地展示数据和数据分析结果。最在这门课程中,你将练习设计和令人信服地显展示“业务数据的故事”,利用这些可视化技术:测试方法和设计原则,你可以获得更高效的沟通和展示方式。
数据可视化
伊利诺伊大学香槟分校
https://www.coursera.org/learn/datavisualization
在这一课程中,你可以系统地了解数据可视化的基本知识。同时,学到数据挖掘的基本概念及其基础的方法和应用,然后深入到数据挖掘的子领域——模式发现中,深入学习模式发现的概念、方法,及应用。这一课程将给你提供学习技能和实践的机会,将可扩展的模式发现方法应用在在大体量交易数据上,讨论模式评估指标,以及学习用于挖掘各类不同数据的模式:序列模式,以及子图模式等方法。
五、机器学习
machine learning
斯坦福大学
https://www.coursera.org/learn/machine-learning
这几乎是coursera上最为经典的课程之一了,来自coursera的开创者吴恩达。课程广泛介绍了机器学习、数据挖掘和统计模式识别。相关主题包括:(i) 监督式学习(参数和非参数算法、支持向量机、核函数和神经网络)。(ii) 无监督学习(集群、降维、推荐系统和深度学习)。(iii) 机器学习实例(偏见/方差理论;机器学习和AI领域的创新)。课程将引用很多案例和应用,例如智能机器人(感知和控制)、文本理解(网络搜索和垃圾邮件过滤)、计算机视觉、医学信息学、音频、数据库挖掘等领域。
Applied Machine Learning in Python
密歇根大学
https://www.coursera.org/learn/python-machine-learning
机器学习应该更多地专注于技术和方法,而不是这些方法背后的统计。这门课程介绍了机器学习和描述统计的区别,并介绍了scikit学习工具包。数据的维度的问题、聚类数据的任务,以及评估这些集群的问题将被解决。监督的方法建立预测模型来描述,学习者将能够适用于scikit学习预测建模方法在认识过程中的问题数据概化关系(如交叉验证,拟合)。当然,满足这一系列的要求,在课程中都会用python的代码来实现。
推荐系统导论
明尼苏达大学
https://www.coursera.org/learn/recommender-systems
推荐系统已经改变了人们找到产品,信息,甚至其他人的方式。该课程全面深入地阐述了推荐系统及其应用,比如常用的推荐算法,包括基于内容的过滤,用户协同过滤,项目协同过滤,降维,互动评论推荐等等。有一些实际的动手项目,其中每一个将涉及实施和评估的一些类型的推荐。除了专题讲座外,课程中还有来自学术界和工业界的专家访谈和嘉宾讲座。
实用预测分析:模型与方法
华盛顿大学
https://www.coursera.org/learn/predictive-analytics
这门课程将帮助你内在的核心集实用和有效的机器学习方法和概念,并将它们应用于解决现实世界的问题。能够设计有效的实验,并分析结果;使用重采样方法,让统计参数变得更加清晰;在复杂问题中应用核心的分类方法(随机森林),以及相关的优化方法(梯度下降);应用无监督学习的方法;描述大规模图表分析中的日常用语,通过结构化查询,遍历和递归查询,PageRank等等。
Regression Models
约翰霍普金斯大学
https://www.coursera.org/learn/regression-models
回归模型,线性模型的一个子集,是一个数据科学家的工具包中最重要的统计分析工具。这门课程涵盖了回归分析,最小二乘法和使用回归模型推理。特殊情况下的回归模型,方差分析和协方差分析将会获得更好的结果,残差和变率分析在课程中得以研究。课程将涵盖用现代思维进行模型选择,和散点平滑回归模型的新用途的思考。
Neural Networks for Machine Learning
多伦多大学
https://www.coursera.org/learn/neural-networks
机器学习大神Hinton亲自授课,这一点就足以让该课程成为经典。学习这门课程你将会了解人工神经网络,以及它们是如何被用于机器学习,适用于语音和物体识别,图像分割,建模语言和人类的运动等,课程中强调的基本算法和实际的技巧,让它们在现实的场景中很好的工作。
以上的课程大概是Coursera上面关于数据科学比较好的课程了,足够建立一个基本的数据科学体系。好的资源常有,如何利用这些资源,才是更重要的事情。
以上的课程都是可以免费听的,但是不能提交作业和获取证书,如果需要,是必须另外付费的。
还有的小伙伴看到现在的Coursera都在大肆推广专项课程,而专项课程都是要付费的,官方在专项课程里完全隐藏了免费听课的入口。
当然,你还是可以免费获取专项课程里每一门课程,在列表中找到每一门课程,然后分别搜索,就可以啦。
比如我们在一个专项课程中看到有如下课程,都是要收费的,而且很贵。
然后我们在Coursera的搜索引擎中搜索我们想要上的课,以《数据科学家的工具箱为例》,会出现以下结果:
找到该课程的非专项课程,例子中 就在搜索结果的第一个,点击进入该课程页面:
然后马上注册,就可以听课啦!!!
当然,还是不能获取评分项目,不能提交作业和获取证书,不过,只要学到了知识,又有什么影响呢?
不过,如果你需要证书或者有参与评分项目的需求,付费也是不错的选择,当然前提是保证你能够正常地坚持学习再购买,因为你很有可能会浪费(土豪请随意)。
Coursera的愿景是让世界的每一个人都能获得良好的教育,对于Coursera这样提供了很大社会价值并且付出了努力和劳动的平台,适当地付费和鼓励未尝不可。