一、数据仓库
etl,hadoop,开源代码
二、HIVE的优势和特点
支持运行在不同计算平台
支持在HDFS和HBase的分布式查询系统
支持用户定义的函数,scripts,定制格式
JDBC和ODBC驱动
稳定和可靠(生产环境使用)
有一个很大开源社区
三、HIVE vs MapReduce-----Word Count
HIVE代码时候实现大型数据
四、HIVE元数据管理
轻量级内嵌SQL数据库
Metastore
HIVE就像是飞机,处理大数据有优势,不适合小型数据
五、HIVE Interface-Console命令窗口模式
有两种工具:Beeline和命令行(CLI)
有两种模式:命令行模式和交互模式