1,hive的安装
apache所有项目的历史版本网址:archive.apache.org
(1)hive基于Hadoop,要安装hive先要安装hadoop
(2)安装模式
–嵌入模式
元数据信息被存储在hive自带的derby数据库中
只允许创建一个连接
多用于Demo
–本地模式
元数据信息被存储在mysql数据库中
MySQL数据库与hive运行在同一台物理机上
多用于开发测试
–远程模式
元数据信息被存储在mysql数据库中
MySQL数据库与hive运行在不同的物理机上

2 hive的嵌入式安装
Hive是为了解决hadoop中mapreduce编写困难,提供给熟悉sql的人使用的。只要你对SQL有一定的了解,就能通过Hive写出mapreduce的程序,而不需要去学习hadoop中的api。
在部署前需要确认安装jdk以及Hadoop。
(1),到官网下载hive包,一般命名为hive-x.y.z.tar.gz,然后解压

//linux解压命令 
  $ tar -xzvf hive-x.y.z.tar.gz/

(2),设置环境变量 HIVE_HOME = 安装目录:
(3),加入$HIVE_HOME/bin到你的path

$ export PATH=$HIVE_HOME/bin:$PATH

(4),运行下面的命令,新建文件夹作为hive存放数据文件(默认在/user/hive/warehouse)和临时文件(默认在/tmp目录下)的目录

$ $HADOOP_HOME/bin/hadoop fs -mkdir       /tmp
$ $HADOOP_HOME/bin/hadoop fs -mkdir       /user/hive/warehouse
$ $HADOOP_HOME/bin/hadoop fs -chmod g+w   /tmp
$ $HADOOP_HOME/bin/hadoop fs -chmod g+w   /user/hive/warehouse

如果需要修改目录,需要修改$HIVE_HOME/conf/hive-site.xml中的配置。
(5),初始化元数据数据库,这里以默认的derby数据库作为元数据库

//语法    
$HIVE_HOME/bin/schematool -dbType <db type> -initSchema
//执行实例
$HIVE_HOME/bin/schematool -dbType derby -initSchema

注意:这里需要在hive-site.xml配置hive的源数据的路径,否则不能在不同目录下启动hive,配置如下:

<property>
    <name>javax.jdo.option.ConnectionURL</name>
    <value>jdbc:derby:;databaseName=/usr/hive/metastore_db;create=true</value>
    <description>
      JDBC connect string for a JDBC metastore.
      To use SSL to encrypt/authenticate the connection, provide database-specific SSL flag in the connection URL.
      For example, jdbc:postgresql://myhost/db?ssl=true for postgres database.
    </description>
  </property>
  <property>
   <name>hive.metastore.warehouse.dir</name>
   <value>/user/hive/warehouse</value>
  </property>

(6),使用hive命令就可以启动hiveshell了,

$HIVE_HOME/bin/hive

3,hive的远程安装和本地安装