在安装HIVE之前需要在Linux上安装好mysql、hadoop和zookeeper。在这里我介绍一下zookeeper和hive的安装。
zookee安装
没有安装包的可以评论私发你,或者自己去网上找安装包。
1、下载安装包通过xftp将安装包放到Linux中的opt文件夹中。
2、安装包解压

tar -zxf /opt/zookeeper-3.4.5-cdh5.14.2.tar.gz

3、将解压文件放到opt下的soft文件夹中,我把我的软件基本都放在了这个文件夹,你们随意。

mv zookeeper-3.4.5-cdh5.14.2 soft/zk345

4、配置文件的修改,进入zk345文件夹下的conf文件夹中,里面有三个文件,复制一下zoo_sample.cfg改为zoo.cfg

cd /opt/soft/zk345/conf/
cp zoo_sample.cfg zoo.cfg

5、进入到zoo.cfg中

vi zoo.cfg

linux集群后台启动hive linux hive_linux集群后台启动hive


将这里的dataDir的值改为自己的zk345中的tmp位置。

linux集群后台启动hive linux hive_hive_02


还要在最下面加上这样一句话,如图中红框中所示。

6、进入系统配置文件

vi /etc/profile

在最下面加上两句话

export ZOOKEEPER_HOME=/opt/soft/zk345
export PATH=$PATH:$ZOOKEEPER_HOME/bin

然后再激活配置文件`

source /etc/profile

此时zookeeper已经安装好了。
启动一下

zkServer.sh start

用jps命令查看一下进程,后台会多出一个进程QuorumPeerMain。

安装HIVE
1、将下载好的安装包通过xftp拉到Linux上
2、解压安装包

tar -zxf hive-1.1.0-cdh5.14.2.tar.gz

3、将解压文件放到opt文件夹中的soft中,并改名为hive10.

mv hive-1.1.0-cdh5.14.2 soft/hive110

4、修改配置文件,在conf中没有hive-site.xml文件,需要我们自己去新建

cd /opt/soft/hive110/conf
vi hive-site.xml

进入文件后要添加如下的配置信息。

<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
        <property>
                <name>hive.metastore.warehouse.dir</name>
                <value>/usr/hive/warehouse</value>
        </property>
        <property>
                <name>hive.metastore.local</name>
                <value>false</value>  //如果是连接本地数据库,则该值为true
        </property>
        <property>
                <name>javax.jdo.option.ConnectionURL</name>
                <value>jdbc:mysql://192.168.56.105:3306/hive?createDatabaseIfNotExist=true</value>       
                //如果是本地数据库则为localhost:3306,我这里连接的是linux上的数据库
        </property>
        <property>
                <name>javax.jdo.option.ConnectionDriverName</name>
                <value>com.mysql.jdbc.Driver</value>
        </property>
        <property>
                <name>javax.jdo.option.ConnectionUserName</name>
                <value>root</value>
        </property>
        <property>
                <name>javax.jdo.option.ConnectionPassword</name>
                <value>root</value>             //这里是数据库密码,根据个人情况自行更改
        </property>
        //从这里往下的配置文件主要适用于用beeline登录hive数据库时所需的配置,如果不需要可以不写一下配置
        <property>
                <name>hive.server2.authentication</name>
                <value>NONE</value>
        </property>
        <property>
                <name>hive.server2.thrift.client.user</name>
                <value>root</value>
        </property>
        <property>
                <name>hive.server2.thrift.client.password</name>
                <value>root</value>
        </property>
</configuration>

保存退出后还是要添加profile中的环境变量

vi /etc/profile
export HIVE_HOME=/opt/soft/hive110
export PATH=$PATH:$HIVE_HOME/bin

再激活一下

source /etc/profile

在配置文件全部搞定后还有很重要的一步,因为HIVE需要连接数据库,所以我们需要连接数据库所用的一个jar包。
链接:https://pan.baidu.com/s/1X75u6CI98jQuP0Tgf5AB_g
提取码:le5e。
我把我这个maven中的5.1.38版本的jar包放在了网盘上,需要可自取。
启动HIVE
第一次启动HIVE需要运行一下下面的命令,且只有第一次需要

schematool -dbType mysql -initSchema

这是为了在mysql中建立HIVE的数据仓库来存放元数据(表的结构)。
启动HIVE,启动之前先启动hadoop和zookeeper。
hive启动方法:

hive --service metastore
hive

beeline启动方法:

hiveserver2
beeline -u jdbc:hive2://192.168.56.105:10000 -n root

虚拟机地址和我不同的记得改。
hive命令行和beeline都可以操作,但是我个人喜欢用hive命令行。