重点组件:
HDFS:分布式文件系统
MAPREDUCE:分布式运算程序开发框架
Hive:基于大数据技术(文件系统+运算框架)的SQL数据仓库工具
Hbase:基于Hadoop的分布式海量数据库
ZOOKEEPER:分布式协调服务基础组件
Mahout:基于mapreduce/Spark/flink等分布式运算框架的机器学习算法库
Oozie:工作流调度框架
Sqoop:数据导入导出工具
Flume:日志数据采集框架
重点组件:
HDFS:分布式文件系统
MAPREDUCE:分布式运算程序开发框架
Hive:基于大数据技术(文件系统+运算框架)的SQL数据仓库工具
Hbase:基于Hadoop的分布式海量数据库
ZOOKEEPER:分布式协调服务基础组件
Mahout:基于mapreduce/Spark/flink等分布式运算框架的机器学习算法库
Oozie:工作流调度框架
Sqoop:数据导入导出工具
Flume:日志数据采集框架
上一篇:大数据入门基础:Hadoop简介
下一篇: 数据处理流程
5月21日来文心中国行·上海站!共同探讨大模型技术赋能产业级应用创新的发展机遇
举报文章
请选择举报类型
补充说明
0/200
上传截图
格式支持JPEG/PNG/JPG,图片不超过1.9M