1. 在目录下/home/ipms/huang/msisdn.csv  有csv文件msisdn.csv

内容格式如下:

 

2.1查看hdfs上的目录:hdfs dfs -ls /

2.2在hdfs的/tmp目录下建立一个目录

2.2.1建立目录之前:

2.2.2建立目录之后:(命令:hdfs dfs -mkdir /tmp/msisdn_csv)

2.3将本地文件系统的数据上传到hdfs上:

2.4修改文件权限,设置为可读写:hdfs dfs -chmod 777 /tmp/msisdn_csv/msisdn.csv

3.输入命令impala-shell    进入到impala客户端界面,进行建表操作。

3.1 建立外部表ext_msisdn:运行命令:location 的位置需要指定hdfs中的目录。

drop table if exists  ext_msisdncsv;
create   external  table  ext_msisdncsv
(
   msisdn string,
   tt   string
)
row format delimited fields terminated by ','
 
location '/tmp/msisdn_csv/';


 

location 的位置需要指定hdfs中的目录。

 

3.1.1通过show databases查看有哪些数据库,(可以自己建立一个数据库,超出与mysql类似)通过使用use ipms     选择使用哪一个数据库。    

通过show tables查看当前数据库下表,看是否存在建成的表;

3.2建立内部表inner_msisdncsv:

drop table if exists inner_msisdncsv;
create table inner_msisdncsv
( msisdn string ,
   tt string
)row format delimited fields terminated by ',';  (同上一步)

3.2.2 通过select * from  ext_msisdncsv;  查看是否有数据。

3.3把外部表中数据导入到内部表中

insert overwrite table inner_msisdn
select *  from ext_msisdn  ;

结束。

 

如果想进一步加深了解学习