hdfs数据块损坏及修复

原创

南瓜数据客栈 2021-12-30 16:14:48 博主文章分类：hadoop ©著作权

©著作权归作者所有：来自51CTO博客作者南瓜数据客栈的原创作品，请联系作者获取转载授权，否则将追究法律责任

hadoop之hdfs数据块损坏及修复

损坏的原因

HDFS在机器断电或意外崩溃的情况下，有可能出现正在写的数据丢失的问题。再次重启HDFS后，发现hdfs无法启动，查看日志后发现，一直处于安全模式。

1、场景一：断电导致HDFS服务不正常或显示块损坏

模拟损坏效果:

直接的datanode上删除文件一个block的三副本

node-1:rm -rf 数据块 元数据
node-2:rm -rf 数据块 元数据
node-3:rm -rf 数据块 元数据

检查hdfs文件系统健康：hdfs fsck /path

输出损坏的块及其所属的文件列表：hdfs fsck /path -list-corruptfileblocks

定位文件的哪些块分布在哪些机器：

hdfs fsck / -delete 直接删除损坏的文件

-files -locations -blocks -racks 号文件显示坏文件不显示

hdfs debug recoverLease -path 文件位置 -retries 重试次数 #修复指定路径的hdfs文件，尝试多次

自动修复

hdfs自动修复损坏的数据块，当数据块损坏后，DN节点执行directoryscan（datanode进行内存和磁盘那数据集块校验）操作之前，都不会发现损坏。

dfs.datanode.directoryscan.interval:21600

在DN向NN进行blockreport前，都不会恢复数据块

dfs.blockreport.intervalMesc：21600

最终当NN收到blockreport才会进行恢复操作

生产中倾向于使用手动修复的方法去修复损坏的数据块。

上一篇：flink算子

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯