把最近常用到的一些语句做些总结:包括查看库注释,注释中文乱码的解决,创建带注释的表等。

查看库的注释

describe database databasename;

 

hive的注释(comment)中文乱码的解决方法

创建表的时候,comment说明字段包含中文,表成功创建成功之后,desc的时候中文说明显示乱码.如下图所示:

我们知道hive的元数据是有mysql管理的,所以这是mysql的元数据的问题.下面我们就修改一下字符编码

(1)修改表字段注解和表注解

alter table COLUMNS_V2 modify column COMMENT varchar(256) character set utf8;
 alter table TABLE_PARAMS modify column PARAM_VALUE varchar(4000) character set utf8;

(2)修改分区字段注解

alter table PARTITION_PARAMS modify column PARAM_VALUE varchar(4000) character set utf8 ;
 alter table PARTITION_KEYS modify column PKEY_COMMENT varchar(4000) character set utf8;

(3)修改索引注解

alter table INDEX_PARAMS modify column PARAM_VALUE varchar(4000) character set utf8;

修改hive-site.xml配置文件

<property>
     <name>javax.jdo.option.ConnectionURL</name>
     <value>jdbc:mysql://IP:3306/db_name?createDatabaseIfNotExist=true&useUnicode=true&characterEncoding=UTF-8</value>
     <description>JDBC connect string for a JDBC metastore</description>
 </property>

 创建带注释的表:

create database if not exists ads;
 use ads;
 create table if not exists `ads.t_bs_tbname`(
 `ds` string comment '购买日期',
 `appid` string comment '产品标识',
 `uid` string comment '用户uid',
 )
 PARTITIONED BY ( 
   `ms` string)
 ROW FORMAT DELIMITED 
  FIELDS TERMINATED BY '\t';

desc命令

desc 命令是为了展示hive表格的内在属性。例如列名,data_type,存储位置等信息.这个命令常常用在我们对hive表格观察之时,我们想要知道这个hive各个列名(基于这些具体列名我们才可以使用sql语句挑选数据),hive表格的存储位置(有些时候我们需要查看location信息来判断这个hive表格是不是我们所需要的那个)