大数据面试题百日更新索引目录


大数据的学习重在理解,记忆是理解的前提,为了接下来更好的面试,同时方便自己索引,
因此建立此目录.
这是背面试题的第一遍



Day01:hdfs 读写文件过程

Day02 : HDFS 在读取文件的时候,如果其中一个块突然损坏了怎么办 HDFS 在上传文件的时候,如果其中一个 DataNode 突然挂掉了怎么办

Day03 : NameNode 在启动的时候会做哪些操作

Day04 : Secondary NameNode 了解吗,它的工作机制是怎样的

Day05 : Secondary NameNode 不能恢复 NameNode 的全部数据,那如何 保证 NameNode 数据存储安全

Day06 : 在 NameNode HA 中,会出现脑裂问题吗?怎么解决脑裂

Day07 : 小文件过多会有什么危害,如何避免

Day08 : 请说下 HDFS 的组织架构

Day09 : 请说下 MR 中 Map Task 的工作机制 请说下 MR 中 Reduce Task 的工作机制

Day10 : 请说下 MR 中 shuffle 阶段 shuffle 阶段的数据压缩机制了解吗