spark作用是什么 spark作用是什么意思

关注 mob64ca14116c53

文章目录

Spark是什么
一个一统的软件栈
Spark适用场景

spark作用是什么 spark作用是什么意思

转载

mob64ca14116c53 2023-10-20 21:14:39

文章标签 spark作用是什么 Spark 大数据云计算迭代 文章分类 Spark 大数据

Spark是什么

Spark是一个用来实现快速而通用的集群计算平台。
（集群计算：把一台电脑无法解决的问题，放到多台电脑组成的集群上解决）
Spark的一个主要特点就是能够在内存中进行运算，因此，Spark在计算速度上有很大的优势。处理大规模数据集是，速度是非常重要的，Spark在迭代处理计算上，比hadoop快100倍。即使时必须在磁盘上进行的复杂计算，Spark依然比MapReduce更加高效。
总的来说，Spark适用于各种原先需要多种不同的分布式平台的场景，包括批处理、迭代算法、交互式查询、流处理。

Spark为什么比mapreduce快？

1）基于内存计算，减少低效的磁盘交互；
2）高效的调度算法，基于DAG；
3）容错机制Linage。
（精华部分就是DAG和Lingae）

一个一统的软件栈

Spark 项目包含多个紧密集成的组件。
Spark 的核心是一个对由很多计算任务组成的、运行在多个工作机器或者是一个计算集群上的应用进行调度、分发以及监控的计算引擎。
由于Spark 的核心引擎有着速度快和通用的特点，因此Spark 还支持为各种不同应用场景专门设计的高级组件，比如SQL 和机器学习等。这些组件关系密切并且可以相互调用，这样你就可以像在平常软件项目中使用程序库那样，组合使用这些的组件。

spark作用是什么 spark作用是什么意思_云计算

Spark适用场景

Spark是基于内存的迭代计算框架，适用于需要多次操作特定数据集的应用场合。需要反复操作的次数越多，所需读取的数据量越大，受益越大，数据量小但是计算密集度较大的场合，受益就相对较小

由于RDD的特性，Spark不适用那种异步细粒度更新状态的应用，例如web服务的存储或者是增量的web爬虫和索引。就是对于那种增量修改的应用模型不适合。

总的来说Spark的适用面比较广泛且比较通用。

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

赞
收藏
评论
分享
举报

上一篇：Android 更换Linux内核安卓改linux系统

下一篇：mysql用select建表 mysql建表查询

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

举报文章

请选择举报类型

内容侵权涉嫌营销内容抄袭违法信息其他

具体原因

包含不真实信息涉及个人隐私

原文链接（必填）

补充说明

0/200

上传截图

格式支持JPEG/PNG/JPG，图片不超过1.9M

已经收到您得举报信息，我们会尽快审核

鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 24年11月软考 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

51CTO博客

首页
关注
排行榜
软考题库

科目全、试题精、讲解专业，扫码免费刷

搜索历史清空

热门搜索

查看【】的结果
写文章
创作中心
登录注册