把最近常用到的一些语句做些总结:包括查看库注释,注释中文乱码的解决,创建带注释的表等。
查看库的注释
describe database databasename;
hive的注释(comment)中文乱码的解决方法
创建表的时候,comment说明字段包含中文,表成功创建成功之后,desc的时候中文说明显示乱码.如下图所示:
我们知道hive的元数据是有mysql管理的,所以这是mysql的元数据的问题.下面我们就修改一下字符编码
(1)修改表字段注解和表注解
alter table COLUMNS_V2 modify column COMMENT varchar(256) character set utf8;
alter table TABLE_PARAMS modify column PARAM_VALUE varchar(4000) character set utf8;
(2)修改分区字段注解
alter table PARTITION_PARAMS modify column PARAM_VALUE varchar(4000) character set utf8 ;
alter table PARTITION_KEYS modify column PKEY_COMMENT varchar(4000) character set utf8;
(3)修改索引注解
alter table INDEX_PARAMS modify column PARAM_VALUE varchar(4000) character set utf8;
修改hive-site.xml配置文件
<property>
<name>javax.jdo.option.ConnectionURL</name>
<value>jdbc:mysql://IP:3306/db_name?createDatabaseIfNotExist=true&useUnicode=true&characterEncoding=UTF-8</value>
<description>JDBC connect string for a JDBC metastore</description>
</property>
创建带注释的表:
create database if not exists ads;
use ads;
create table if not exists `ads.t_bs_tbname`(
`ds` string comment '购买日期',
`appid` string comment '产品标识',
`uid` string comment '用户uid',
)
PARTITIONED BY (
`ms` string)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '\t';
desc命令
desc 命令是为了展示hive表格的内在属性。例如列名,data_type,存储位置等信息.这个命令常常用在我们对hive表格观察之时,我们想要知道这个hive各个列名(基于这些具体列名我们才可以使用sql语句挑选数据),hive表格的存储位置(有些时候我们需要查看location信息来判断这个hive表格是不是我们所需要的那个)