hive内嵌式安装

原创

mob64ca12f8da8d 2023-11-18 13:04:46 ©著作权

文章标签 Hive hive xml 文章分类 Hive 大数据

©著作权归作者所有：来自51CTO博客作者mob64ca12f8da8d的原创作品，请联系作者获取转载授权，否则将追究法律责任

Hive内嵌式安装

Hive是一个开源的数据仓库解决方案，它建立在Hadoop之上，提供了一个SQL-like查询语言HiveQL来查询和分析存储在Hadoop集群中的大数据。

在本文中，我们将介绍如何进行Hive的内嵌式安装，并提供一些代码示例来帮助读者更好地理解。

1. 安装前准备

在进行Hive的内嵌式安装之前，我们需要确保已经安装和配置好了Hadoop。如果你还没有安装Hadoop，可以参考[Hadoop官方文档](

2. 下载和解压Hive

首先，我们需要下载Hive的二进制文件。可以在[Hive官方网站](

下载完成后，将压缩包解压到你选择的目录下。假设我们将Hive解压到了/opt/hive目录下。

3. 配置Hive

接下来，我们需要配置Hive的环境变量和属性。

3.1 配置环境变量

打开~/.bashrc文件，并添加以下内容：

export HIVE_HOME=/opt/hive
export PATH=$PATH:$HIVE_HOME/bin

保存并退出文件。然后执行以下命令使环境变量生效：

source ~/.bashrc

3.2 配置属性

进入Hive的配置目录：

cd $HIVE_HOME/conf

复制hive-default.xml.template文件，并重命名为hive-site.xml：

cp hive-default.xml.template hive-site.xml

打开hive-site.xml文件，并添加以下属性：

<configuration>
  <property>
    <name>javax.jdo.option.ConnectionURL</name>
    <value>jdbc:derby:/opt/hive/metastore_db;create=true</value>
    <description>JDBC connect string for a JDBC metastore.</description>
  </property>
  <property>
    <name>hive.metastore.warehouse.dir</name>
    <value>/user/hive/warehouse</value>
    <description>location of default database for the warehouse</description>
  </property>
  <property>
    <name>hive.exec.scratchdir</name>
    <value>/tmp/hive</value>
    <description>location of Scratch space</description>
  </property>
  <property>
    <name>hive.querylog.location</name>
    <value>/tmp/hive</value>
    <description>location of Hive query log</description>
  </property>
</configuration>

保存并退出文件。

4. 启动Hive Metastore

Hive Metastore是Hive的元数据存储服务，我们需要启动它以便Hive正常运行。

打开一个新的终端窗口，并执行以下命令：

cd $HIVE_HOME
bin/hive --service metastore &

5. 启动Hive CLI

Hive CLI是Hive提供的一个交互式命令行界面，我们可以使用它来执行HiveQL语句。

在终端窗口中执行以下命令启动Hive CLI：

cd $HIVE_HOME
bin/hive

现在，你已经成功地安装和启动了Hive。可以尝试执行一些简单的HiveQL语句来验证安装是否成功。

以下是一个简单的示例：

CREATE TABLE employees (
   id INT,
   name STRING,
   age INT,
   salary FLOAT
) ROW FORMAT DELIMITED
FIELDS TERMINATED BY ',';

LOAD DATA LOCAL INPATH '/path/to/employees.csv' INTO TABLE employees;

SELECT * FROM employees;