Hadoop源码解读之(一)>>>>>>>>>>NameNode


    正如大多数源码解读,第一篇为NameNode的解析。


    首先将NameNode注释翻译一下,大概意思如下:

 

    1.NameNode 服务器有两个作用:

        a.目录名称空间的管理者

        b.维护 hadoop 分布式系统的“inode table”

    2.NameNode维护着两个关键的对应关系

        a.文件名和block 块

        b.block 块和其对应的存储机器

        其中:第一个对应关系存储在磁盘中,第二个对应关系在每次NameNode启动的时候被加载到内存中。

    3.NameNode主要的工作是向外界暴露IPC接口、HTTP服务和一些参数管理


    4.NameNode实现了3个接口:

        a.ClientProtocol:允许Client请求服务,但是ClientProtocol不是被用来让最终用户使用的,最终用户使用FileSystem来对HDFS进行操作。

        b.DatanodeProtocol:DataNode使用该接口来存储block块,这些方法被DataNode调用。

        c.NamenodeProtocol:该接口被secondary namenode或者balance进程调用去获取局部的NameNode信息,如局部的blockMap等。


----解释完注释,来看一下代码内容----

    首先找见NameNode的构造函数

    

    public NameNode(Configuration conf) throws IOException {
    this(conf, NamenodeRole.NAMENODE);
  }
    protected NameNode(Configuration conf, NamenodeRole role) 
      throws IOException

    可以看出最终NameNode实例化走的都是后者。

    

    下面进入main方法:

    

    找见最重要的一句话 

NameNode namenode = createNameNode(argv, null);

    点进去,然后是switch代码块,这里就是我们在命令行里面敲hdfs dfs -X的解析部分。