hadoop小练习 hadoop题

转载

mob64ca14061c9e 2023-09-01 08:53:21

文章标签 hadoop小练习 HDFS 上传 bc 文章分类 Hadoop 大数据

以下是我上hadoop课程时由老师提供的习题集（利用Hadoop提供的shell命令完成任务）：

一、将HDFS中指定文件的内容输出到终端中；

hadoop小练习 hadoop题_bc

二、显示HDFS中指定的文件的读写权限、大小、创建时间、路径等信息；

hadoop小练习 hadoop题_上传_02

三、给定HDFS中某一个目录，输出该目录下的所有文件的读写权限、大小、创建时间、路径等信息，如果该文件是目录，则递归输出该目录下所有文件相关信息；

“ hadoop fs -ls -R ” ：对子目录也进行ls操作，就是递归输出信息*

hadoop小练习 hadoop题_HDFS_03

四、删除HDFS中指定的文件；

hadoop小练习 hadoop题_HDFS_04

五、删除HDFS中指定的目录，由用户指定目录中如果存在文件时是否删除目录；

hadoop小练习 hadoop题_bc_05

六、向HDFS中上传任意文本文件，如果指定的文件在HDFS中已经存在，由用户指定是追加到原有文件末尾还是覆盖原有的文件；

1. 在本地/root/tmp里创建了文件a.txt,内容如下图：

hadoop小练习 hadoop题_HDFS_06

2. 编写shell脚本并上传文件a.txt到hdfs上/tmp/a.txt,因为最开始上面并没有a.txt，所以就进行了上传并覆盖（添加），如下图：

hadoop小练习 hadoop题_HDFS_07

七、从HDFS中下载指定文件，如果本地文件与要下载的文件名称相同，则自动对下载的文件重命名；

1. 写个脚本myfile（path：/root/tmp/myfile.sh），echo “yes”or“no”可以看作一个标签，执行到哪里就就输出相应的标签；本人更认可创建脚本文件编写脚本程序，在这里最大的好处是对脚本代码的维护修改起到了很大的作用，如上第一题在命令行输入脚本指令一按回车后需要修改代码就特别不方便了，特别是指令多而繁琐的时候，如下图：

hadoop小练习 hadoop题_HDFS_08