sparking society游戏 spark the

关注 mob64ca140eb362

sparking society游戏 spark the

转载

mob64ca140eb362 2024-02-07 11:14:29

文章标签 sparking society游戏大数据 python 人工智能 API 文章分类 Spark 大数据

本书出自OReilly的《Spark: The Definitive Guide Big Data Processing Made Simple》，由Matei Zaharia, Bill Chambers两位大佬所写，是2018年2月的第一版（我也不清楚有没有最新版，搜也没搜到第二版）

参考本书主页介绍，着眼于Spark 2.0的改进，探索Spark结构化API的基本操作和常用功能，以及用于构建端到端流应用程序的新型高级API Structured Streaming。学习监控，调优和调试Spark的基础知识，并探索机器学习技术和场景，以便使用Spark的可扩展机器学习库MLlib。

轻松了解大数据和Spark
通过工作示例了解DataFrames，SQL和Datasets-Spark的核心API
深入了解Spark的低级API，RDD以及SQL和DataFrame的执行
了解Spark如何在群集上运行
调试，监视和调整Spark集群和应用程序
了解结构流，Spark的流处理引擎的强大功能
了解如何将MLlib应用于各种问题，包括分类或推荐

OReilly它家的书都是把代码和案例放在github上的，这本书也不例外，见此databricks/Spark-The-Definitive-Guid

实际上，这并非我初学Spark了，之前也有所涉猎，但想着能够深入学习，便计划写下文章加深自己理解，以及分享知识。

本书并非是对原作的翻译，好像目前国内也没有出版社翻译了这本书，仅仅是叙述自己读书的心得、想法，并结合自己之前所学加以新内容。

计划
计划第1、2、3章
计划作废，和大多书一样前面内容都是总览性内容，实际性的东西也很杂，所以先放置待后期补上吧
计划4、5、6章吧，（～5.26）
已完成4、5，预计可达成
机器学习相关第24～31不打算看

目录

书籍分为以下七大部分：

大数据和Spark概述

Chapter 1 to 2：了解Apache Spark
Chapter 3：了解Spark的工具集

结构化API——DataFrames, SQL, and Datasets

Chapter 4：结构化API预览
Chapter 5：基本结构化API操作
Chapter 6：处理不同类型的数据
Chapter 7：聚合操作
Chapter 8：join 连接操作
Chapter 9：数据源
Chapter 10：Spark SQL 用 SQL 来操作

底层API

Chapter 12：弹性分布式数据集（RDDs）
Chapter 13：高级的 RDDs
Chapter 14：分布式共享变量

生产上的应用

Chapter 15：Spark 如何在集群上运行
Chapter 16：开发 Spark 应用程序
Chapter 17：部署 Spark
Chapter 18：监控和调试
Chapter 19：性能调优

Streaming流

Chapter 20：Stream 流处理基础
Chapter 21：结构化Streaming流的基础
Chapter 22：事件时间（Event-time）和状态处理
Chapter 23：生产中的结构化流处理

高级数据分析和机器学习

Chapter 24：高级分析和机器学习预览
Chapter 25：预处理和特征工程
Chapter 26：分类
Chapter 27：回归
Chapter 28：Recommendation 推荐
Chapter 29：非监督性学习
Chapter 30：图分析
Chapter 31：深度学习

Spark 生态

Chapter 32：语言细节: Python (PySpark)和 r (SparkR 和 sparklyr)
Chapter 33：生态和社区

收录于此：josonle/Spark-The-Definitive-Guide-Learning，优先上传到本仓库

更多推荐： Coding Now

学习记录的一些笔记，以及所看得一些电子书eBooks、视频资源和平常收纳的一些自己认为比较好的博客、网站、工具。涉及大数据几大组件、Python机器学习和数据分析、Linux、操作系统、算法、网络等

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

赞
收藏
评论
分享
举报

上一篇：delphi怎么获取python的执行结果 delphi python

下一篇：java海康视频推送到云上实时播放海康视频导出

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

举报文章

请选择举报类型

内容侵权涉嫌营销内容抄袭违法信息其他

具体原因

包含不真实信息涉及个人隐私

原文链接（必填）

补充说明

0/200

上传截图

格式支持JPEG/PNG/JPG，图片不超过1.9M

已经收到您得举报信息，我们会尽快审核

鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 24年11月软考 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

51CTO博客

首页
关注
排行榜
精品课程
免费直播
软考题库

科目全、试题精、讲解专业，扫码免费刷

搜索历史清空

热门搜索

查看【】的结果
写文章
创作中心
登录注册