Alter Table 语句
Hive修改表名,列名,列注释,表注释,增加列,调整列顺序,属性名等操作
它是在Hive中用来修改的表。
语法
声明接受任意属性,我们希望在一个表中修改以下语法。
1. ALTER TABLE name RENAME TO new_name
2. ALTER TABLE name ADD COLUMNS (col_spec[, col_spec ...])
3. ALTER TABLE name DROP [COLUMN] column_name
4. ALTER TABLE name CHANGE column_name new_name new_type
5. ALTER TABLE name REPLACE COLUMNS (col_spec[, col_spec ...])
(1)、重命名表
Rename To… 语句
ALTER TABLE table_name RENAME TO new_table_name;
上面这个命令可以重命名表,数据所在的位置改变,但分区名都没有改变。
下面是查询重命名表,把 employee 修改为 emp。
ALTER TABLE employee RENAME TO emp;
(2)、改变列名/类型/位置/注释
1. ALTER TABLE table_name CHANGE
2. [CLOUMN] col_old_name col_new_name column_type
3. [CONMMENT col_conmment]
4. [FIRST|AFTER column_name];
这个命令可以修改表的列名,数据类型,列注释和列所在的位置顺序,FIRST将列放在第一列,AFTER col_name将列放在col_name后面一列,
例子1:
ALTER TABLE test_table CHANGE col1 col2 STRING COMMENT 'The datatype of col2 is STRING' AFTER col3;
上面的语句将列名col2修改为col2,数据类型为STRING并添加注释,最后将这一列放在col3后面。
例子2:下表包含employee表的字段,它显示的字段要被更改(粗体)。
字段名 | 从数据类型转换 | 更改字段名称 | 转换为数据类型 |
eid | int | eid | int |
name | String | ename | String |
salary | Float | salary | Double |
designation | String | designation | String |
下面查询重命名使用上述数据的列名和列数据类型:
1. hive> ALTER TABLE employee CHANGE name ename String;
2. hive> ALTER TABLE employee CHANGE salary salary Double;
(3)、增加/更新列
ADD COLUMNS允许用户在当前列的末尾,分区列之前添加新的列,REPLACE COLUMNS允许用户更新列,更新的过程是先删除当前的列,然后在加入新的列。注:只有在使用native的SerDE时才可以这么做。
ALTER TABLE table_name ADD|REPLACE COLUMNS (col_name data_type [CONMMENT col_comment], ...);
添加列语句,下面的查询增加了一个列名dept在employee表。
hive> ALTER TABLE employee ADD COLUMNS (dept STRING COMMENT 'Department name');
REPLACE语句
以下从employee表中查询删除的所有列,并使用emp替换列:
hive> ALTER TABLE employee REPLACE COLUMNS ( eid INT empid Int, ename STRING name String);
(4)、增加表的属性
ALTER TABLE table_name SET TBLPEOPERTIES table_properties;
用户可以使用这个语句增加表属性,table_properties的结构为(property_name=property_value,property_name=property_value, ...),目前last_modified_time(最后修改时间),last_modified_user(做最后修改的用户)是由Hive自动管理的。用户可以向列中添加自己的属性,然后使用DISCRIBE EXTEBDED TABLE来获取这些信息。
(5)、增加SerDE属性
1. ALTER TABLE table_name SET SERDE serde_class_name
2. [WHIT SERDEPROPERTIES serde_properties];
ALTER TABLE table_name SET SERDEPROPERTIES serde_properties;
上面两个命令都允许用户想SerDE对象增加用户定义的元数据。Hive为了序列化和反序列化数据,将会初始化SerDE属性,并将属性传给表的SerDE。这样用户可以为自定义的SerDe存储属性。上面serde_properties的结构为(property_name=property_value,property_name=property_value, ...)。
(6)、修改表文件格式和组织
1. ALTER TABLE table_name SET FILEFORMAT file_format;
2. ALTER TABLE table_name CLUSTERED BY (col_name, col_name, ...)
3. [SORTED By (col_name, ...)] INTO num_buckets BUCKETS;
上面两个命令都修改了表的物理属性。
(7)分区操作:
1)修改分区名
alter table table_name partition(dt='partition_old_name') rename to partition(dt='partition_new_name')
2)修改分区属性
alter table table_name partition column (dt partition_new_type)
3)修改分区位置
alter table table_name partition (createtime='20190301') set location "new_location"
4)添加分区
alter table table_name add partition (partition_name = 'value') location '***'
--示例
alter table table_name add IF NOT EXISTS partition (createtime='20190301') location '/user/hive/warehouse/testdw/js_nk_wn'
--还可以同时添加多个分区,只需要在后面继续追加就行
alter table table_name add partition (createtime='20190301') location '/user/hive/warehouse/dept_part' partition (createtime='20190228') location '/user/hive/warehouse/dept_part'
5)删除分区
--删除一级分区
alter table table_name drop if exists partition(createtime='20190301')
--删除二级分区
alter table table_name drop if exists partition (month='02',day='12')
6)修改表的字节编码
alter table table_name set serdeproperties ('serialization.encoding'='utf-8');