hadoop FileSystem 如何进行flush hadoop fs count

转载

mob6454cc7b19b2 2023-05-18 17:15:12

文章标签 hadoop jar HDFS 文章分类 Hadoop 大数据

1. shell 获取 HDFS文件个数

>适用于查看碎片程度

hadoop fs -count /user |  awk '{print $2}'
11(我的返回是11)

hadoop fs -count /user(你的路径)  返回的是 文件夹数 文件数  大小

|  awk '{print $2}'  获取前者的第二列 , 也就是文件数目

2. Hadoop 提交作业(最基本)

hadoop jar /usr/app/hadoop-wordcount-1.0.jar \

com.ssss.WordCountApp  \

/wordcount/input.txt   /wordcount/output/WordCountApp

具体解释:

第一行是jar包的位置 ,

第二行是主类class所处的位置

第三行 , 输入和输出的位置 , 位于你的HDFS文件系统中

ps(你的集群版本必须和你的IDEA中hadoop的版本要一致 , 才能运行)

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

51CTO博客