学习致谢:
https://www.bilibili.com/video/BV1Xz4y1m7cv?p=41
需求:
从TCP Socket数据源实时消费数据,对每批次Batch数据进行词频统计WordCount,流程图如下:
准备工作
1.在node01上安装nc命令
nc是netcat的简称,原本是用来设置路由器,我们可以利用它向某个端口发送数据
代码的实现:
虚拟机端输入
然后输入每个流的数据信息,依据回车判定一批的数据
每隔5秒算一批,如果没有发,则为空
https://www.bilibili.com/video/BV1Xz4y1m7cv?p=41
从TCP Socket数据源实时消费数据,对每批次Batch数据进行词频统计WordCount,流程图如下:
准备工作
1.在node01上安装nc命令
nc是netcat的简称,原本是用来设置路由器,我们可以利用它向某个端口发送数据
虚拟机端输入
然后输入每个流的数据信息,依据回车判定一批的数据
每隔5秒算一批,如果没有发,则为空
萌新学习笔记
本期学习笔记介绍【CAD建模号】中图形绘制区的二维工具、面建模、实体工具和文本工具。
学习致谢https://www.bilibili.com/video/BV1Xz4y1m7cv?p=45添加链接描述代码实现pack
rk的对比...
D的一个分区会依赖于父RDD的1个分区–错误父EDD的一个分区会被子RDD的1个分区所依赖–正确为什么要区分宽窄依赖对窄依赖:并行化+容错宽依赖:进行阶段划分,(shuffle后的阶段需要
举报文章
请选择举报类型
补充说明
0/200
上传截图
格式支持JPEG/PNG/JPG,图片不超过1.9M