===> 什么是 Storm? --> Twitter将Storm正式开源了,这是一个分布式的、容错的实时计算系统,遵循 Eclipse Public License 1.0。 -->
===> 环境架构部署规划: bigdata1 NameNode ResourceManager Zookeeper JournalNode failOverController bigdata2 NameNode ResourceManager Zookeeper JournalNode failOverController bigdata3 DataNode NodeM
===> Zookeeper 是什么? => ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,是Google的Chubby一个开源的实现,是Hadoop和Hbase的重要组件。
HUE是什么HUE=Hadoop User ExperienceHue是一个开源的Apache Hadoop UI系统,由Cloudera Desktop演化而来,最后Cloudera公司将其贡献给Apache基金会的Hadoop社区,它是基于Python Web框架Django实现的。通过使用Hue我们可以在浏览器端的Web控制台上与Hadoop集群进行交互来分析处理数据,例如操作HDFS上的数
Sqoop数据分析引擎安装与使用==>什么是Sqoop?Sqoop是一个开源的数据处理引擎,主要是通过JDBC为媒介,在Hadoop(Hive)与传统的关系型数据库(Oracle,MySQL,Postgres等)间进行数据的传递HDFSHiveHBaseJDBC>Oracle,MySQL,==>Sqoop的安装:1.将安装包解压:tarzxfsqoop-1.4.6.bin__hadoop-0.23
Pig 简介: Pig 是 Apache 项目的一个子项目,Pig 提供了一个支持大规模数据分析的平台,Pig 突出的特点就是它的结构经得起大量并行任务的检验,使得它能够处理大规模数据集Pig 特点: Pig 可简化 MapReduce 任务的开发&nb
&n
什么是 Hive Hive 是一个翻译器,它可以将SQL语句翻译成一个 MapReduce 程序 常见的数据分析引擎: Hive, Pig, Impala,&nbs
HBase 是一个 NoSQL 数据库什么是 NoSQL 数据库? 基于 Key-value 来保存数据 NoSQL 数据库不支持事物 &n
hadoop
Copyright © 2005-2024 51CTO.COM 版权所有 京ICP证060544号