Python数据分析,如何系统入门_python

 

最近有很多人在问,Python数据分析的一些问题。关于到底应该怎么学?如何快速入门,以及技术和业务之间的瓶颈如何突破?于是总结了一些经验,希望能够给还没入门、或者入门之后就遇到瓶颈的新手一些建议。主要是关于如何系统地进行学习规划,以及可以避免的一些坑。 

 

要学数据分析之前,至少要了解一下,做一个数据分析师,到底需要哪些技能。事实上,学习任何技能都是这样,以对应的岗位所需的技能来作为学习的向导,总归是没错的。 

 

有的同学看到数据分析几个字,就马上开始Python函数+控制语句、R语言和ggplot库……上来一顿骚操作,还没入门就放弃了。这就是需求不明确导致的,当然学习方式也值得商榷,那到底数据分析需要什么样的技能呢? 这里作为例子,从招聘网站上找了几个数据分析的岗位,我们来看看具体的要求是怎样的。  

 

Python数据分析,如何系统入门_python_02             Python数据分析,如何系统入门_python_03            Python数据分析,如何系统入门_python_04

 

其实企业对数据分析师的基础技能需求差别不大,可总结如下:
  • 分析工具:一般要求SPSS/SAS/R/Python等分析工具至少会一种,会两种以上加分,有的企业因内部需求,会指定的一种;
  • 数据库:绝大会要求会SQL,部分要求SQL/NoSQL会一种,高级的分析师或者大型企业要求能够处理大数据,需要Hive(较少的需要Hadoop/Spark);
  • 统计学:若无相关专业背景,需要具备相应的统计学、概率论等基础知识;
  • 数据挖掘:少部分要求会建模,了解基本的算法模型,能够做数据预测,即便不要求,算法也是加分项;
  • 结果输出:Excel/PPT/Tableau。Excel和PPT要求的比较多,主要用作常规的数据呈现,与业务部门沟通等,Tableau一般作为可视化或者分析工具的加分项或者要求之一;
  • 业务/思维:对某个领域(如电商、金融等)相关业务的了解或具有产品、运营方向的分析经验,有自己的数据分析的方法论和项目经验,具备Data Sence。

 

看上去很简单呀,对吧,但其实你把每个技能拆分开来,都是一个不小的知识体系。如果我们按照数据分析的流程来细分的话,每个部分应该掌握的技能,大概是这样的:          Python数据分析,如何系统入门_python_05

 

 

那对于这个技能体系,应该如何进行技能的训练呢?先后顺序是什么?哪些地方可能出现困难和瓶颈?这可能是初学者最困惑的地方,我们可以看看数据分析的不同层次:

- ❶ -

懂基本操作,能上手进行探索性分析

 

这个要求真的不高,如果是用Excel,也就是画个分布图、用用场函数和Vlookup的事情,当然对于专业数据分析师而言,仅会Excel是远远不够的,特别是对于拥有海量数据的巨头。 用Python来做的话,也就是numpy、pandas和matplotlib的一些基本操作,简单来说,你需要掌握基本的数据分析处理和可视化,进行探索性的数据分析,观察数据分布、计算各种统计量,得出一些基本的结论。  当然你还需要补补基本的统计知识。 所以开始上手的话,就两个部分,Python库(numpy、pandas、matplotlib/seaborn)和统计学知识,当然你可以找一些数据集来进行这些操作。 在这个时候你已经可以做一些基本的数据清洗、数据分析工作了,像数据专员这样的职位都可以尝试,如果懂一些业务,初级数据分析的工作也可以着手了。  这个阶段的工作主要进行基本数据处理,对于明确的分析任务能够进行技术上的基本实现,能够正常推进具体的分析计划落地实施。  而处于这个阶段,欠缺的能力在于技术的熟练度、全面性以及整体业务分析的规划。 一方面是对于实际的项目缺乏多重技术的对比,对于复杂项目缺乏有效实施手段;二是对于整体的业务缺乏清晰的拆解方向,对于用什么指标,需要构建什么模型等问题的缺乏系统性思考。   

- ❷ -

深入技术,做全方位的数据分析

 

能够做基本的操作之后,接下来你应该可以更深入下去了,Python数据分析三剑客(Numpy/Pandas/Matplotlib)更深入的操作,掌握更多的技巧,以满足不同的数据和场景 所以这应该是一个连续的、循序渐进的过程。 当然这个时候你更多的是要通过具体的数据集,去进行真实场景的分析,尽可能多的从不同的角度进行探索,得出更多的结论。 考虑到更多的场景,你可能还需要数据库(SQL or NoSQL)的技能,至少能够顺利提取、查询公司的数据库,能够通过数据库的管理实现基本的数据清洗和分析。  还有就是爬虫的技术,如果你有获取网络数据的需求,你需要掌握另外的Python包(比如BeautifulSoup、Requests等)。当然这些可能并不是当下必须的技术,可以等到有需求的时候再去学习。  总的来说,这个部分,是数据分析工具深入和全面实战的部分。 确定你能够熟练完成项目并输出结果后,就完全可以去尝试初级数据分析师相关的职位了。  当然在此之前,你需要去大量进行项目练习,一来为熟悉流程和工具,二来培养分析思维,这些项目经验也是求职的优质资源。    

- ❸ -

从数据分析到数据挖掘

别慌,并不是要去真正地系统学习数据挖掘。只是在做数据分析的时候,通常会涉及到预测型的数据分析,比如预测广告的点击、出行需要的时间、未来某个时间的销售额……这些对未来情况的预测是做决策的重要依据。 

 

那其实就是要掌握一些数据挖掘的方法,比如逻辑回归、朴素贝叶斯方法、决策树等等。当然你需要用到Python库scikit-learn,scikit-learn里都可以直接调用这些算法,初级阶段,知道怎么调用就可以了。  但随着深入,你会有了解算法原理的需求,那可以帮助你去调参,提升算法效果。当然特征选择也是提升预测效果不可忽视的部分,如果算法应用没问题了,可以尝试做特征工程提升效果。  数据挖掘技能(或者说算法能力)并不是分析师的必修项目,但你去看招聘JD就会发现,这是一个很好的加分项,优秀的分析师应该具有一定的构建算法模型的能力。     

- ❹ -

从数据分析到商业决策

 

老实说,这个步骤并不是最后来训练的,而是贯穿在整个数据分析的过程中。因为数据分析的本质,或者说终极追求是为商业目的服务的,比如提供用户增长的策略,为销售提升提供解决办法,通过数据分析提供更人性化的用户体验…… 方法、技巧皆为工具,你将会总结出自己的一些方法论,如何通过一个完整的分析得出一个高价值的商业报告,甚至是一套自动化分析决策的商业系统(比如推荐系统,用户画像系统,风险模型)。  这些才是更高层次的数据分析工作应该去做的事情,在任何项目推进之前明确目标,并系统地解决数据获取、数据存储、数据建模和可视化呈现的问题,推动整个项目的进度。  我们的终极目的不是去获取几个数据,也不是呈现几张炫酷的图表,而是去探索一个问题的解决方案,寻找一个市场的突破口,以技术的方式去降低策略制定的风险。  所以当你不再聚焦于具体的技术点、工作流程,而是重于不同业务指标的选取,解决问题的模型的构建,高效和低成本的决策辅助等时候,你就真正上升到比较高的层次了。     - 系统学习成为分析师 -

 

所以,如果你是真的想系统地去学习数据分析,从工具、流程、业务、思维等层面逐个击破,有目的地系统学习和基于真实项目进行训练,以learning by doing 的形式,我想把这门课推荐给你。

 

Python数据分析,如何系统入门_python_06DC学院的数据分析师训练营完全以职业为导向,通过实际的项目流程,训练真实的工作技能。十周的系统训练,除了掌握基础的技能,还有能获得大量的项目经验。
 这是训练营的第1期开班,优惠力度足够大(名额有限),相信之后你不太能够以如此低的价格加入,或者说是参与类似的系统性训练
 

十周系统训练,掌握专业数据分析师的技能

第二期名额开放,立减200,优惠限前20名

开课7天内无理由退款

↓ 扫码了解训练营详情 

 

Python数据分析,如何系统入门_python_07 

课程问题、优惠券领取

扫下方二维码添加Amy小姐姐 

Python数据分析,如何系统入门_python_08

  

01 

课程设计

为了打造这样的训练营,我们花了6个月的时间去打磨:

 

????为了保证技能的全面性和深度

我们调研了众多的数据分析岗位,和数十位分析师进行了深度的内容探讨。

让课程内容能够满足主流企业的需求,也具备不同行业、领域的数据思维和分析方法。

????在学习的流畅性方面,我们也对学习路径进行了数十次的迭代,从技能板块的学习逻辑到细节知识的设置和筛选。

既让课程能够使不同背景的同学高效学习,也尽可能地提升学员能够达到的技能上限。

 

????特别是案例和作业项目部分,尽量地还原真实工作中的业务流程,融入尽可能多的技能栈,所以每个项目都是训练的综合应用能力,和解决实际问题的能力。我们始终坚信,大量的真实训练,才是知识内化和迁移的关键

 

以下就是我们这次训练营的课程主体大纲(学习计划周次可以扫码了解),十周的训练,足以让你打败市面上多半所谓的据分析师:       Python数据分析,如何系统入门_python_09        

02 

实战案例

除了课程中实时穿插的小案例巩固细节知识点,另有6大企业项目实战,涉及电商、房产、金融、招聘、社交等多领域。

 

这些案例在课程中都有详细的讲解,关于问题拆解的思路,使用的技术细节,代码的编写,以及逐步的效果展示

 

帮助你训练数据采集、分析方法、编程技巧、模型搭建、报告撰写等全方位技能,丰富项目经验

 

Python数据分析,如何系统入门_python_10Python数据分析,如何系统入门_python_11Python数据分析,如何系统入门_python_12Python数据分析,如何系统入门_python_13Python数据分析,如何系统入门_python_14Python数据分析,如何系统入门_python_15      

 

 

03 

作业项目

除了众多的实战案例帮助你实时巩固技术之外,另外每周都有基于真实业务问题的作业项目。你需要根据每周的学习,来解决这些在工作中存在的问题。最重要的是,每周提交的作业项目都有老师1v1批改逐行代码审阅,评估学习效果,并给出针对性的学习建议。可以很负责任地说,认真完成这些作业项目,最终形成的这个作品集,将可以成为你求职就业非常棒的加分项
Python数据分析,如何系统入门_python_16△ 部分作业列表 Python数据分析,如何系统入门_python_17△ 内测学员部分作业批改

 

 

 

 

04 

学习收益

训练营完全按照数据分析师职位的技能需求进行打造,既保证技能的全和深,也在此基础上尽量简化学习的内容,以提高效率 当然,必要的横向的扩展还是会有的,比如小规模数据的Excel分析,利用其它可视化/报告工具进行数据分析报告的输出,这些必要的技能在课程中会有所涉及,也是数据分析师的绝对加分项。 总体来说,你将得到工具使用、编程能力、数据库能力、分析能力、数据思维五个方向的锻炼,成为具有综合能力的分析师,而不是数据处理员。Python数据分析,如何系统入门_python_18