一、数据仓库

etl,hadoop,开源代码

二、HIVE的优势和特点

支持运行在不同计算平台

支持在HDFS和HBase的分布式查询系统

支持用户定义的函数,scripts,定制格式

JDBC和ODBC驱动

稳定和可靠(生产环境使用)

有一个很大开源社区

初识HIVE(1)_命令行

三、HIVE vs MapReduce-----Word Count

--Define metadata for the source
CREATE EXTERNAL TABLE lines(line STRING);
LOAD DATA INPATH 'book' OVERWRITE INTO TABLE lines;
--word count
SELECT word,count(*) as world_count
FROM lines
LATERAL VIEW explode(split(text,' ')) t1 as world
GROUP BY word;

HIVE代码时候实现大型数据

四、HIVE元数据管理

轻量级内嵌SQL数据库

Metastore

HIVE就像是飞机,处理大数据有优势,不适合小型数据

初识HIVE(1)_命令行_02

五、HIVE Interface-Console命令窗口模式

有两种工具:Beeline和命令行(CLI)

有两种模式:命令行模式和交互模式

初识HIVE(1)_大数据_03


初识HIVE(1)_命令行_04

初识HIVE(1)_命令行_05