050 sqoop的使用

转载

mb5fe947dd062d3 2016-11-09 20:31:00

文章标签 hdfs mysql hive sqoop 数据库 文章分类 代码人生

一：导入 mysql--》hdfs

1.准备

　　 050 sqoop的使用_mysql

2.导入数据

　　可以看到在跑yarn。

　　 050 sqoop的使用_hdfs_02

3.在HDFS上看结果

　　默认的地址：hdfs的家目录。

　　 050 sqoop的使用_数据库_03

4.在HDFS上指定目录

　　 050 sqoop的使用_hive_04

5.指定map的个数，相同目录时，先删除原来的目录

　　 050 sqoop的使用_sqoop_05

6.查看结果

　　 050 sqoop的使用_sqoop_06

7.指定分隔符

　　默认是‘，’，在HDFS上修改‘\t’

　　 050 sqoop的使用_mysql_07

8.重新查看结果

　　 050 sqoop的使用_hdfs_08

9.更快的方式

　　 050 sqoop的使用_mysql_09

10.增量导入之前的准备

　　 050 sqoop的使用_mysql_10

11.增量导入

　　在增量导入的时候，不能加上--delete---target-dir，因为这是增量导入

　　 050 sqoop的使用_hive_11

12.查看增量结果

　　 050 sqoop的使用_hive_12

二：job实现增量导入（属于Mysql导入Hdfs）

1.创建一个job任务之前的任务

　　 050 sqoop的使用_数据库_13

2.创建一个job任务

　　注意：命令为 --create

　　　　　--与import之间有一个空格。

　　 050 sqoop的使用_hive_14

3.查看一个job

　　 050 sqoop的使用_数据库_15

4.查看job的详细信息

　　 050 sqoop的使用_sqoop_16

5.执行job任务

　　 050 sqoop的使用_hdfs_17

6.删除job任务

　　 050 sqoop的使用_数据库_18

二：导入 mysql-->hive

1.在HIVE中新建一个数据库和一个表

　　方便mysql里面的数据导入。

　　 050 sqoop的使用_hdfs_19

2.展示源表tohdfs的数据

　　 050 sqoop的使用_hdfs_20

3.导入一

　　 050 sqoop的使用_数据库_21

4.结果

　　 050 sqoop的使用_sqoop_22

5.导入二

　　 050 sqoop的使用_hive_23

6.结果

　　 050 sqoop的使用_数据库_24

三：导出：hdfs-》mysql

1.新建mysql数据表

　　 050 sqoop的使用_hdfs_25

2.命令

　　bin/sqoop export --connect jdbc:mysql://linux-hadoop3.ibeifeng.com:3306/sqoop --username root --password 123456 --table tomysql --export-dir /user/hive/warehouse/student.db/stu_info --num-mappers 1 --input-fields-terminated-by '\t'

　　 050 sqoop的使用_sqoop_26

3.结果

　　 050 sqoop的使用_hive_27

四：导出hive-》mysql

1.基本语法同上。

　　只需要把--export-dir改成HIVE的路径就可以了。

　　但是会发现，上面的HDFS上的路径就是HIVE的路径，所以HIVE的导出例子依旧可以使用上面的例子。

　　在HDFS的导出中，可以使用HDFS上的任何一个路径，而不是HIVE中需要时warehouse的路径。

五：执行sqoolwenjian

1.新建数据库

　　 050 sqoop的使用_数据库_28

2.新建sqoop.file，里面是将执行的文件

　　 050 sqoop的使用_sqoop_29

3.执行

　　 050 sqoop的使用_hive_30

4.结果

　　 050 sqoop的使用_mysql_31

六：使用帮助

1.用法

　　 050 sqoop的使用_hive_32

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：051 日志案例分析（PV，UV），以及动态分区

下一篇：049 CDH商业版本的搭建（hadoop5.3.6 +hive+sqoop）

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

050 sqoop的使用

050 sqoop的使用

51CTO博客