《Python数据分析与挖掘实战》

 在当今大数据驱动的时代,要想从事机器学习、人工智能、数据挖掘等前沿技术,离不开数据跟踪与分析,通过NumPy、Pandas等进行数据科学计算,通过Seaborn、Matplotlib等进行数据可视化展示,从实战的角度出发,让你在数据科学领域迈出重要的一步,开启数据分析与挖掘的开发之旅。

目前数据分析与挖掘行业火爆,人才供不应求。机器学习、自然语言处理、数据可视化、数据探索、数据分析和数据挖掘,这些火热的前沿技术都是数据科学体系的范畴,是信息时代的高薪领域。而Python是用于数据分析与挖掘的必备工具!  

大数据时代是海量数据同完美计算能力相结合的产物,确切地说是移动互联网、物联网产生了海量的数据,大数据计算技术完全胜任海量数据的收集、存储、计算、分析等问题。综合来看,未来几年大数据在商业智能、智慧城市和精准营销等领域的应用将发挥主导作用。

  读者需要了解的重要信息

 本书作为数据分析与挖掘专业的图书,介绍数据挖掘的算法流程、必备工具和实践方法,案例采用Python3来实现。本书涵盖从数据获得到数据处理和结果展示输出的全过程,以数据分析与挖掘五大环节(数据采集、数据预处理、探索分析、挖掘建模、模型评估)为轴线,理论与实践相结合,所有案例均具有代表性,明确了数据分析与挖掘目标及完成效果。分析挖掘的基本任务是从数据中提取商业价值,具体涵盖分类和预测、聚类分析、关联规则、时序模式、偏差检验、智能推荐等。

本书以真实案例驱动,配以分析用的数据与源代码,科学系统地介绍数据分析与挖掘建模领域的科学思维、必备知识、专业工具、完整流程以及编程技巧,让你能够快速胜任数据分析师岗位。

本书内容  

本书整体分为15章,系统讲解机器学习的典型算法,主要内容如下:

第1章简要介绍大数据获取,第2章是数据预处理,第3章是探索性数据分析,第4章是用Sklearn估计器分类,第5章是主流数据分析库,第6章是大数据数据库介绍,第7章是数据仓库/商业智能,第8章是数据聚合与分组运算,第9章是数据挖掘工具,第10章是挖掘建模,第11章是模型评估,第12章是社会媒体挖掘,第13章是用图挖掘分类,第14章是基于深度神经网络的验证码识别,第15章是基于深度学习的文本分类挖掘实现。 

源代码和源数据下载  

本书的例子都是在Python3集成开发环境Anaconda3中通过实际调试的典型案例。配套的示例源代码和源数据可通过使用微信扫描下方的二维码获取(可通过下载页面,把链接发到自己的邮箱中下载)。

据数据挖掘和分析groupby实训总结 数据挖掘与分析实战_数据挖掘