Alter Table 语句

Hive修改表名,列名,列注释,表注释,增加列,调整列顺序,属性名等操作

它是在Hive中用来修改的表。
语法
声明接受任意属性,我们希望在一个表中修改以下语法。

1. ALTER TABLE name RENAME TO new_name
2. ALTER TABLE name ADD COLUMNS (col_spec[, col_spec ...])
3. ALTER TABLE name DROP [COLUMN] column_name
4. ALTER TABLE name CHANGE column_name new_name new_type
5. ALTER TABLE name REPLACE COLUMNS (col_spec[, col_spec ...])

(1)、重命名表

Rename To… 语句

ALTER TABLE table_name RENAME TO new_table_name;

上面这个命令可以重命名表,数据所在的位置改变,但分区名都没有改变。

下面是查询重命名表,把 employee 修改为 emp。

ALTER TABLE employee RENAME TO emp;

(2)、改变列名/类型/位置/注释

1. ALTER TABLE table_name CHANGE
2. [CLOUMN] col_old_name col_new_name column_type
3. [CONMMENT col_conmment]
4. [FIRST|AFTER column_name];

这个命令可以修改表的列名,数据类型,列注释和列所在的位置顺序,FIRST将列放在第一列,AFTER col_name将列放在col_name后面一列,

例子1:

ALTER TABLE test_table CHANGE col1 col2 STRING COMMENT 'The datatype of col2 is STRING' AFTER col3;

上面的语句将列名col2修改为col2,数据类型为STRING并添加注释,最后将这一列放在col3后面。

例子2:下表包含employee表的字段,它显示的字段要被更改(粗体)。

字段名

从数据类型转换

更改字段名称

转换为数据类型

eid

int

eid

int

name

String

ename

String

salary

Float

salary

Double

designation

String

designation

String

下面查询重命名使用上述数据的列名和列数据类型:

1. hive> ALTER TABLE employee CHANGE name ename String;
2. hive> ALTER TABLE employee CHANGE salary salary Double;

(3)、增加/更新列  

ADD COLUMNS允许用户在当前列的末尾,分区列之前添加新的列,REPLACE COLUMNS允许用户更新列,更新的过程是先删除当前的列,然后在加入新的列。注:只有在使用native的SerDE时才可以这么做。

ALTER TABLE table_name ADD|REPLACE COLUMNS (col_name data_type [CONMMENT col_comment], ...);

添加列语句,下面的查询增加了一个列名dept在employee表。

hive> ALTER TABLE employee ADD COLUMNS (dept STRING COMMENT 'Department name');

REPLACE语句

以下从employee表中查询删除的所有列,并使用emp替换列:

hive> ALTER TABLE employee REPLACE COLUMNS ( eid INT empid Int, ename STRING name String);

(4)、增加表的属性

ALTER TABLE table_name SET TBLPEOPERTIES table_properties;

用户可以使用这个语句增加表属性,table_properties的结构为(property_name=property_value,property_name=property_value, ...),目前last_modified_time(最后修改时间),last_modified_user(做最后修改的用户)是由Hive自动管理的。用户可以向列中添加自己的属性,然后使用DISCRIBE EXTEBDED TABLE来获取这些信息。
 

(5)、增加SerDE属性

1. ALTER TABLE table_name SET SERDE serde_class_name
2. [WHIT SERDEPROPERTIES serde_properties];
ALTER TABLE table_name SET SERDEPROPERTIES serde_properties;

上面两个命令都允许用户想SerDE对象增加用户定义的元数据。Hive为了序列化和反序列化数据,将会初始化SerDE属性,并将属性传给表的SerDE。这样用户可以为自定义的SerDe存储属性。上面serde_properties的结构为(property_name=property_value,property_name=property_value, ...)。

(6)、修改表文件格式和组织

1. ALTER TABLE table_name SET FILEFORMAT file_format;
2. ALTER TABLE table_name CLUSTERED BY (col_name, col_name, ...)
3. [SORTED By (col_name, ...)] INTO num_buckets BUCKETS;

上面两个命令都修改了表的物理属性。

(7)分区操作:

1)修改分区名
alter table table_name partition(dt='partition_old_name') rename to partition(dt='partition_new_name')
 
2)修改分区属性
alter table table_name partition column (dt partition_new_type)
 
3)修改分区位置
alter table table_name partition (createtime='20190301') set location "new_location"
 
4)添加分区
alter table table_name add partition (partition_name = 'value') location '***'
--示例
alter table table_name add IF NOT EXISTS partition (createtime='20190301') location '/user/hive/warehouse/testdw/js_nk_wn'
 
--还可以同时添加多个分区,只需要在后面继续追加就行
alter table table_name add partition (createtime='20190301') location '/user/hive/warehouse/dept_part' partition (createtime='20190228') location '/user/hive/warehouse/dept_part' 
 
5)删除分区
--删除一级分区
alter table table_name drop if exists partition(createtime='20190301')
--删除二级分区
alter table table_name drop if exists partition (month='02',day='12')
 
6)修改表的字节编码
alter table table_name set serdeproperties  ('serialization.encoding'='utf-8');