flume 采集数据写入mysql flume采集

转载

mob6454cc680fc0 2023-10-12 11:03:50

文章标签 flume 采集数据写入mysql 安装包日志采集传递数据 文章分类 MySQL 数据库

文章目录

日志采集框架Flume介绍

概述
运行机制
Flume采集系统结构图

Flume安装部署

上传安装包
解压安装包
配置文件

在一个完整的离线大数据处理系统中，除了 hdfs+mapreduce+hive 组成分析系统的核心之外，还需要

数据采集、结果

数据导出、

任务调度等不可或缺的辅助系统，而这些辅助工具在hadoop生态体系中都有便捷的开源框架，如图所示：

flume 采集数据写入mysql flume采集_日志采集

日志采集框架Flume介绍

概述

Flume是一个分布式、可靠和高可用的海量日志采集、聚合和传输的系统。
Flume可以采集文件，socket数据包、文件、文件夹、Kafka等各种形式源数据，又可以将采集到的数据(下沉 sink) 输出到 HDFS、Hive、Kafka等众多外部存储系统中。
一般的采集需求，通过Flume的简单配置即可实现。
Flume针对特殊场景也具有良好的自定义扩展能力。

因此，Flume可以适用于大部分的日常数据采集场景。

运行机制

Flume分布式系统中最核心的角色是agent，Flume采集系统是由一个个agent所连接起来形成。
每一个agent相当于一个数据传递员，内部有三个组件：

Source：采集组件，用于跟数据源对接，以获取数据
Channel：传输通道组件，用于从Source将数据传递到Sink。
Sink：下沉组件，用于往下一级agent传递数据或者往最终存储系统传递数据

Source 到 Channel 到 Sink之间传递数据的形式是Event事件；Event事件是一个数据流单元。

Flume采集系统结构图

简单结构：单个agent采集数据
复杂结构：多级agent之间串联

Flume安装部署

上传安装包

apache-flume-1.8.0-bin.tar.gz

flume 采集数据写入mysql flume采集_日志采集_04

解压安装包

cd /export/servers/
tar -zxvf /export/softwares/apache-flume-1.8.0-bin.tar.gz

flume 采集数据写入mysql flume采集_传递数据_05

配置文件

cd /export/servers/
cd apache-flume-1.8.0-bin/conf/
cp flume-env.sh.template flume-env.sh
vim flume-env.sh

添加以下内容：

export JAVA_HOME=/export/servers/jdk1.8.0_144

flume 采集数据写入mysql flume采集_日志采集_06

flume 采集数据写入mysql flume采集_传递数据_07

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：java 多数据库多连接池 spring 数据库连接池多数据源

下一篇：Rxjava 如何自定义线程池 rxjava 简书

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

flume 采集数据写入mysql flume采集

flume 采集数据写入mysql flume采集

文章目录

日志采集框架Flume介绍

概述

运行机制

Flume采集系统结构图

Flume安装部署

上传安装包

解压安装包

配置文件

51CTO博客