这节主要学习 HiveQL 查询语言

HiveQL 是 Apache Hive 的查询语言,它使用类 SQL 语法,在 Hive 中可以使用 HiveQL 查询和处理分布式存储的数据。

以下是一些 HiveQL 的常用语法和示例:

  1. 创建表格:
CREATE TABLE my_table (
   id INT,
   name STRING,
   age INT
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ',';
  1. 在表格中插入数据:
INSERT INTO my_table VALUES (1, 'Tom', 22);
  1. 查询表格:
SELECT * FROM my_table;
  1. 修改表格:
ALTER TABLE my_table ADD COLUMN gender STRING;
  1. 聚合查询:
SELECT COUNT(*) FROM my_table;
SELECT AVG(age), MAX(age), MIN(age) FROM my_table WHERE gender = 'male';
  1. 连接查询:
SELECT t1.id, t1.name, t2.sale
FROM table1 t1
JOIN table2 t2
ON t1.id = t2.id;
  1. 分组查询:
SELECT gender, AVG(age) FROM my_table GROUP BY gender;
  1. 排序查询:
SELECT * FROM my_table ORDER BY age DESC;
  1. 子查询:
SELECT id, name FROM my_table WHERE age IN (SELECT age FROM my_table WHERE gender = 'male');

以上是 HiveQL 的一些常用语法和示例。HiveQL 基本上支持大部分 SQL 的基本语句,包括 SELECT、JOIN、GROUP BY、ORDER BY 等等。

使用过程中遇到了问题,可以参考 Hive 的官方文档并进行进一步的学习和了解。