Hadoop的运行模式分为3种:本地运行模式,伪分布运行模式,集群运行模式,相应概念如下:
单机(本地)模式:这种模式在一台单机上运行,没有分布式文件系统,而是直接读写本地操作系统的文件系统。在单机模式(standalone)中不会存在守护进程,所有东西都运行在一个jvm上。这里同样没有dfs,使用的是本地文件系统。单机模式适用于开发过程中运行mapreduce程序,这也是最少使用的一个模式。
伪分布式模式:也是在一台单机上运行,但用不同的java进程模仿分布式运行中的各类结点(namenode,datanode,jobtracker,tasktracker,secondarynamenode),伪分布式(pseudo)适用于开发和测试环境,在这个模式中,所有守护进程都在同一台机器上运行。
全分布式模式:全分布模式通常被用于生产环境,使用n台主机组成一个hadoop集群,hadoop守护进程运行在每台主机之上。这里会存在namenode运行的主机,datanode运行的主机,以及tasktracker运行的主机。在分布式环境下,主节点和从节点会分开。