是一计算模型。输入部分来自于HDFS,输出部分写入到HDFS。

分为两阶段,先是map阶段然后是reduce阶段。

1.        map读取hdfs中的数据,然后把原始数据进行规范处理

2.        reduce是接受map阶段输出的数据,自身进行汇总,然后把结果写入到hdfs中