大数据出行项目

转载

mob604756f4ef89 2021-10-02 17:10:00

大数据出行项目_java程序

数据生产--传输到日志平台--数据存储--数据计算--数据应用

大数据出行项目_数据_02

大数据出行项目_java程序_03

flume 日志服务消息中间件 kafka 流式处理 flink和spark streaming 批处理 spark 储存 hdfs和hadoop

B为list的父类

大数据出行项目_mapreduce_04

大数据出行项目_数据_05

大数据出行项目_mapreduce_06

大数据出行项目_spark_07

scala是sparrk的前身

mapreduce启动的是进程，spark启动的是线程

sparrk属于微批次处理 flink属于真正的流计算

MapReduce慢，慢在磁盘存储还有shuffle优化

在java里面调用一些shell脚本会缩短连接时间

linux执行的时候，kernel套着shell，shell上层是jvm，jvm上层是java程序

调shell的时候损失的是kernel调shell 以及jvm调kernel api的过程

直接调c语言（原生）要损失的是compile和link的过程

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：Mabtis

下一篇：spark

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

51CTO博客