hive添加字段代码 hive添加一个字段

转载

IT独行侠客 2023-06-06 22:18:56

文章标签 hive添加字段代码 android 前端后端字段 文章分类 Hive 大数据

文章目录

新增字段

1、方法1

cascade知识

2、方法2 （适用于外部表）
3、方法3（下下策）

修改字段
删除列

新增字段

1、方法1

alter table 表名 add columns (列名 string COMMENT '新添加的列') CASCADE;
 
alter table 表名 add columns (列名 string COMMENT '新添加的列')；
 
 
hive表中指定位置增加一个字段
 
分两步，先添加字段到最后（add columns），然后再移动到指定位置（change）
 
alter table 表名 add columns (列名 string comment '当前时间'); -- 正确，添加在最后
alter table 表名 change 列名 string after 指定位置的列名; -- 正确，移动到指定位置,address字段的后面

添加之后字段由于hive底层是文件和系列化的设计，因此查数据会发现新增的列在所有已有列的后面

CASCADE会刷历史分区字段

cascade知识

cascade的中文翻译为“级联”，也就是不仅变更新分区的表结构（metadata），同时也变更旧分区的表结构。
对于删除操作也是，级联删除表中的信息，当表A中的字段引用了表B中的字段时，一旦删除B中该字段的信息，表A的信息也自动删除。（当父表的信息删除，子表的信息也自动删除）
标准语法如下：

hive添加字段代码 hive添加一个字段_前端

2、方法2 （适用于外部表）

当分区过多的情况下，直接使用alter就行增加字段会报错

第一步：删除分区，当分区过多可以写个for循环

alter table table_name drop if exists partition(par_col=col_name)

第二步：使用alter操作就行添加字段，这时候就不会因为分区过多报错

第三步：进行修复分区

msck repair table 表名;

3、方法3（下下策）

创建新表修改表名，进行存储原表数据

将原表进行drop，再对新表进行改名操作

ALTER TABLE old_name RENAME TO new_name;

修改字段

alter table table_name change column 已有列 修改名称 类型 comment '';

删除列

Hive不能直接删除列，不然底层系列化就乱了，我们可以通过replace语句来替换整张表的字段，达到同样的效果

alter table table_name replace columns(column_1 string);

语句中只写想要保留的字段就可以

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：python 海林格距离 hellinger distance海林格距离

下一篇：java json数组去重复数据 java数组去除重复数据

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

hive添加字段代码 hive添加一个字段

hive添加字段代码 hive添加一个字段

文章目录

新增字段

1、方法1

cascade知识

2、方法2 （适用于外部表）

3、方法3（下下策）

修改字段

删除列

51CTO博客