官网文档

目录

1. 把数据追加到文件中 (-appendToFile)

2. 查看文件内容 (-cat) [-ignorecrc 对CRC校验失败的文件使用]

3. 校验和 校验数据是否完整(-checksum)

4. 修改文件所属组 (-chgrp)

5. 修改文件权限 (-chmod)

6. 修改文件所属用户和组 (-chown)

7.  从本地上传文件到集群 (-copyFromLocal)

8. 把集群文件复制到本地文件系统 (-copyToLoacl)

9. 统计文件夹中文件和文件夹的数量 (-count)

10. 把集群的一个文件拷贝到集群另一个文件夹中 (-cp)

11. 创建快照 (-createSnapshot)

12. 删除快照 (-deleteSnapshot)

13. 查看集群文件目录使用情况 (-df)

14. 查看集群文件大小 (-du)

15. 清空回收站 (-expunge)

16. 查找文件或文件夹 (-find)

17. 下载集群文件到本地 (-get)

18. 显示文件访问控制列表 (-getfacl)

19. 查看文件扩展属性 (-getfattr)

20. 将某个文件夹中的文件合并下载到本地 (-getmerge)

21. 展示目录 (-ls)

22. 创建文件夹 (-mkdir)

23. 移动本地文件到集群 (-moveFromLocal) 

24. 移动集群文件到本地 (-moveToLocal) [该方法未实现]

25. 移动文件或目录 (-mv) [可从回收站移出]

26. 上传文件到集群 (-put)

27. 删除文件 (-rm)

28. 删除空目录 (-rmdir)

29. 查看文件尾部内容 (-tail) [展示尾部1kb的文件内容]


查看hadoop分布式文件系统中的指令集

[hadoop@hdgroup01 ~]$ hadoop fs 
Usage: hadoop fs [generic options]
        [-appendToFile <localsrc> ... <dst>]
        [-cat [-ignoreCrc] <src> ...]
        [-checksum <src> ...]
        [-chgrp [-R] GROUP PATH...]
        [-chmod [-R] <MODE[,MODE]... | OCTALMODE> PATH...]
        [-chown [-R] [OWNER][:[GROUP]] PATH...]
        [-copyFromLocal [-f] [-p] [-l] [-d] <localsrc> ... <dst>]
        [-copyToLocal [-f] [-p] [-ignoreCrc] [-crc] <src> ... <localdst>]
        [-count [-q] [-h] [-v] [-t [<storage type>]] [-u] [-x] <path> ...]
        [-cp [-f] [-p | -p[topax]] [-d] <src> ... <dst>]
        [-createSnapshot <snapshotDir> [<snapshotName>]]
        [-deleteSnapshot <snapshotDir> <snapshotName>]
        [-df [-h] [<path> ...]]
        [-du [-s] [-h] [-x] <path> ...]
        [-expunge]
        [-find <path> ... <expression> ...]
        [-get [-f] [-p] [-ignoreCrc] [-crc] <src> ... <localdst>]
        [-getfacl [-R] <path>]
        [-getfattr [-R] {-n name | -d} [-e en] <path>]
        [-getmerge [-nl] [-skip-empty-file] <src> <localdst>]
        [-help [cmd ...]]
        [-ls [-C] [-d] [-h] [-q] [-R] [-t] [-S] [-r] [-u] [<path> ...]]
        [-mkdir [-p] <path> ...]
        [-moveFromLocal <localsrc> ... <dst>]
        [-moveToLocal <src> <localdst>]
        [-mv <src> ... <dst>]
        [-put [-f] [-p] [-l] [-d] <localsrc> ... <dst>]
        [-renameSnapshot <snapshotDir> <oldName> <newName>]
        [-rm [-f] [-r|-R] [-skipTrash] [-safely] <src> ...]
        [-rmdir [--ignore-fail-on-non-empty] <dir> ...]
        [-setfacl [-R] [{-b|-k} {-m|-x <acl_spec>} <path>]|[--set <acl_spec> <path>]]
        [-setfattr {-n name [-v value] | -x name} <path>]
        [-setrep [-R] [-w] <rep> <path> ...]
        [-stat [format] <path> ...]
        [-tail [-f] <file>]
        [-test -[defsz] <path>]
        [-text [-ignoreCrc] <src> ...]
        [-touchz <path> ...]
        [-truncate [-w] <length> <path> ...]
        [-usage [cmd ...]]

Generic options supported are:
-conf <configuration file>        specify an application configuration file
-D <property=value>               define a value for a given property
-fs <file:///|hdfs://namenode:port> specify default filesystem URL to use, overrides 'fs.defaultFS' property from configurations.
-jt <local|resourcemanager:port>  specify a ResourceManager
-files <file1,...>                specify a comma-separated list of files to be copied to the map reduce cluster
-libjars <jar1,...>               specify a comma-separated list of jar files to be included in the classpath
-archives <archive1,...>          specify a comma-separated list of archives to be unarchived on the compute machines

The general command line syntax is:
command [genericOptions] [commandOptions]

1. 把数据追加到文件中 (-appendToFile)

    [-appendToFile <localsrc> ... <dst>]

hadoop淘汰 hadoop cleanup_hadoop

hadoop fs -appendToFile 本地文件 集群文件路径

 

hadoop淘汰 hadoop cleanup_本地文件_02

hadoop淘汰 hadoop cleanup_本地文件_03

hadoop淘汰 hadoop cleanup_hadoop_04

可以看到已经追加到了文件中

2. 查看文件内容 (-cat) [-ignorecrc 对CRC校验失败的文件使用]

    [-cat [-ignoreCrc] <src> ...]

hadoop淘汰 hadoop cleanup_Hadoop文件系统操作指令_05

    2.1 查看全部内容

hadoop fs -cat 集群文件路径

    2.2 随机查看几条内容

hadoop fs -cat /集群文件路径 | shuf -n 条数

    

hadoop淘汰 hadoop cleanup_文件路径_06

    2.3 查看前几条内容

hadoop fs /集群文件路径 | head -条数

   

hadoop淘汰 hadoop cleanup_hadoop淘汰_07

 

    2.4 查看后几行内容

hadoop fs -tail /集群文件路径 | tail -条数

    

hadoop淘汰 hadoop cleanup_文件路径_08

3. 校验和 校验数据是否完整(-checksum)

    [-checksum <src> ...]

hadoop淘汰 hadoop cleanup_本地文件_09

hadoop fs -checksum 集群路径

hadoop淘汰 hadoop cleanup_本地文件_10

4. 修改文件所属组 (-chgrp)

    [-chgrp [-R] GROUP PATH...]

hadoop淘汰 hadoop cleanup_hadoop_11

hadoop fs -chgrp 组权限 集群路径

hadoop淘汰 hadoop cleanup_文件路径_12

5. 修改文件权限 (-chmod)

    [-chmod [-R] <MODE[,MODE]... | OCTALMODE> PATH...]

hadoop淘汰 hadoop cleanup_hadoop_13

hadoop fs -chmod 修改1,修改2,修改3 集群文件路径

或 

hadoop fs -chmod 数字 集群文件路径

u修改所属用户权限,g修改所属组权限,o修改其他人的权限,a修改所有人的权限

+ 增加权限,-删除权限

r可读权限,w可写权限,x可执行权限

4可读权限,2可写权限,1可执行权限,7(4+2+1)可读可写可执行,6 (4+2+0) 可读可写不可执行,......

644(所属用户是6权限,所属组是4权限,其他人是4权限),777(所属用户是7权限,所属组是7权限,其他人是7权限),.......

hadoop fs -chmod -R 修改的权限 集群文件夹路径

-R 递归修改文件夹中所有的权限 

hadoop淘汰 hadoop cleanup_文件路径_14

6. 修改文件所属用户和组 (-chown)

    [-chown [-R] [OWNER][:[GROUP]] PATH...]

hadoop淘汰 hadoop cleanup_Hadoop文件系统操作指令_15

hadoop fs -chown 所属用户:所属组 集群文件路径

hadoop淘汰 hadoop cleanup_Hadoop文件系统操作指令_16

7.  从本地上传文件到集群 (-copyFromLocal)

    [-copyFromLocal [-f] [-p] [-l] [-d] <localsrc> ... <dst>]

hadoop fs -copyFromLocal 本地文件路径 集群路径

hadoop淘汰 hadoop cleanup_hadoop淘汰_17

8. 把集群文件复制到本地文件系统 (-copyToLoacl)

    [-copyToLocal [-f] [-p] [-ignoreCrc] [-crc] <src> ... <localdst>]

hadoop fs -copyToLocal 集群文件路径 本地存放路径

hadoop淘汰 hadoop cleanup_hadoop_18

9. 统计文件夹中文件和文件夹的数量 (-count)

    [-count [-q] [-h] [-v] [-t [<storage type>]] [-u] [-x] <path> ...]

hadoop淘汰 hadoop cleanup_hadoop淘汰_19

hadoop fs -count 集群文件夹路径
hadoop fs -count -h -v 集群文件夹路径

hadoop淘汰 hadoop cleanup_本地文件_20

hadoop淘汰 hadoop cleanup_文件路径_21

10. 把集群的一个文件拷贝到集群另一个文件夹中 (-cp)

[-cp [-f] [-p | -p[topax]] [-d] <src> ... <dst>]

hadoop fs -cp 集群文件路径 集群文件夹路径

hadoop淘汰 hadoop cleanup_hadoop淘汰_22

11. 创建快照 (-createSnapshot)

    [-createSnapshot <snapshotDir> [<snapshotName>]]

12. 删除快照 (-deleteSnapshot)

    [-deleteSnapshot <snapshotDir> <snapshotName>]

13. 查看集群文件目录使用情况 (-df)

    [-df [-h] [<path> ...]]

hadoop fs -df -h 集群目录

hadoop淘汰 hadoop cleanup_文件路径_23

14. 查看集群文件大小 (-du)

    [-du [-s] [-h] [-x] <path> ...]

hadoop fs -du -h 集群路径

hadoop淘汰 hadoop cleanup_hadoop_24

15. 清空回收站 (-expunge)

  在conf/core-site.xml中增加一下配置 Hadoop回收站默认是关闭的

<property>  
    <name>fs.trash.interval</name>  
    <value>1440</value>  
    <description>配置hdfs回收站默认保存的时间单位分钟</description>  
</property>

16. 查找文件或文件夹 (-find)

    [-find <path> ... <expression> ...] 

hadoop fs -find 集群目录 -name 找的文件或文件夹名

hadoop淘汰 hadoop cleanup_Hadoop文件系统操作指令_25

17. 下载集群文件到本地 (-get)

    [-get [-f] [-p] [-ignoreCrc] [-crc] <src> ... <localdst>]

hadoop fs -get 集群路径 本地路径

hadoop淘汰 hadoop cleanup_hadoop_26

18. 显示文件访问控制列表 (-getfacl)

    [-getfacl [-R] <path>]

hadoop淘汰 hadoop cleanup_文件路径_27

19. 查看文件扩展属性 (-getfattr)

hadoop淘汰 hadoop cleanup_本地文件_28

20. 将某个文件夹中的文件合并下载到本地 (-getmerge)

hadoop淘汰 hadoop cleanup_hadoop淘汰_29

hadoop fs -getmerge 集群文件夹 本地文件(会自动创建)

hadoop淘汰 hadoop cleanup_hadoop淘汰_30

21. 展示目录 (-ls)

hadoop淘汰 hadoop cleanup_hadoop淘汰_31

22. 创建文件夹 (-mkdir)

    [-mkdir [-p] <path> ...]  如果文件夹存在 可以使用-p创建

hadoop fs -mkdir /集群路径/文件夹名称

hadoop淘汰 hadoop cleanup_本地文件_32

删除文件或文件夹 (-rm)

hadoop淘汰 hadoop cleanup_文件路径_33

23. 移动本地文件到集群 (-moveFromLocal) 

hadoop fs -moveFromLocal 本机文件 集群路径

hadoop淘汰 hadoop cleanup_hadoop_34

    本地文件移动后没有了

24. 移动集群文件到本地 (-moveToLocal) [该方法未实现]

hadoop淘汰 hadoop cleanup_本地文件_35

25. 移动文件或目录 (-mv) [可从回收站移出]

hadoop fs -mv 集群文件 集群文件夹

hadoop淘汰 hadoop cleanup_hadoop_36

26. 上传文件到集群 (-put)

hadoop fs -put 本地文件或文件夹路径 集群路径

hadoop淘汰 hadoop cleanup_文件路径_37

27. 删除文件 (-rm)

hadoop fs -rm 集群文件路径

hadoop fs -rm -r 集群文件夹路径[可以递归删除]

hadoop fs -rm -f 集群文件路径[如果文件不存在不显示错误信息]

hadoop淘汰 hadoop cleanup_hadoop淘汰_38

hadoop淘汰 hadoop cleanup_本地文件_39

hadoop淘汰 hadoop cleanup_本地文件_40

28. 删除空目录 (-rmdir)

hadoop fs -rmdir 集群空目录路径[如果不是空目录则会报错]

hadoop fs -rmdir --ignore-fail-on-non-empty 集群空目录路径[没有错误提示但是也不删除不为空的目录]

hadoop淘汰 hadoop cleanup_Hadoop文件系统操作指令_41

29. 查看文件尾部内容 (-tail) [展示尾部1kb的文件内容]

hadoop fs -tail 集群文件路径

hadoop fs -tail -f 集群文件路径[动态展示文件内容]

hadoop淘汰 hadoop cleanup_Hadoop文件系统操作指令_42