hadoop的归档文件(archive)——har。
目的:减少大量小文件。

  • 归档
hadoop archive -archiveName files.har -p /my/files /my

将/my/files归档后放于/my下。

  • 显示归档文件
hadoop fs -ls -R har:///user/bee/foo.har

归档文件一旦创建便不能修改,想从中增加或删除文件,必须重新归档。