案例为王，实战为主，基于spark2.x机器学习十大案例全方位剖析

原创

qq5d5a5a39ddd7c 2019-08-30 15:43:06 ©著作权

©著作权归作者所有：来自51CTO博客作者qq5d5a5a39ddd7c的原创作品，请联系作者获取转载授权，否则将追究法律责任

课程下载地址：https://pan.baidu.com/s/1LuffQVoVjJjDkN3jT2TfQA 提取码: ytyc

本课程主要讲解Spark MLlib，Spark MLlib是一种高效、快速、可扩展的分布式计算框架；实现了常用的机器学习，如：聚类、分类、回归等算法。本课拒绝枯燥的讲述，将循序渐进从Spark的基础知识、矩阵向量的基础知识开始，然后再透彻讲解各个算法的理论、详细展示Spark源码实现，最后均会通过实例进行解析实战，帮助大家真正从理论到实践全面掌握Spark MLlib分布式机器学习。

十大案例全方位剖析：案例1、基于Kaggle的StumbleUpon数据集构建分类系统案例2、基于BikeSharing数据集构建回归模型案例3、基于NewsCorpora数据集文本处理新闻分类案例4、基于KMeans网络流量检测模型案例5、基于Kaggle Avazu广告数据集构建CRT预测模型案例6、基于聚类KMeans出租车轨迹分析案例7、基于决策树预测森林植被案例8、基于DataFrame API ML预测森林植被案例9、基于Audioscrobbler数据集的音乐推荐案例10、基于MovieLens数据集的电影推荐