MapReduce---＞分区(Partition)

原创

飝鱻? 2021-08-03 10:11:30 博主文章分类：MapReduce ©著作权

文章标签 大数据 hadoop java mapreduce apache 文章分类 Java 后端开发

©著作权归作者所有：来自51CTO博客作者飝鱻?的原创作品，请联系作者获取转载授权，否则将追究法律责任

MapReduce--->分区Partition

简单简绍
- 步骤
代码

简单简绍

这个可以将不同类型的数据在输出的时候进行分类，分类到不同的文件中

步骤

继承Partitioner，实现getPartition方法
分区是从0开始的，即0就是第一个分区
由于分区是在Map阶段之后的，一次Partition的泛型是map端输出的

代码

import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Partitioner;

public class partition extends Partitioner<Text,Flowbean> {

    @Override
    public int getPartition(Text text, Flowbean flowbean, int i) {
        //这一步是获取电话的前三位数字
        String prePhoneNum = text.toString().substring(0,3);
        int partition = 4;//五个分区,从0开始算
        if("136".equals(prePhoneNum)){
            partition = 0;
        }else if ("137".equals(prePhoneNum)){
            partition = 1;
        }else if ("138".equals(prePhoneNum)){
            partition = 2;
        }else if ("139".equals(prePhoneNum)){
            partition = 3;
        }else {
            partition = 4;
        }
        return partition;
    }
}

还要再Driver类里加上一句代码，来使用自定义分区，否则系统还是会使用默认分区

job.setPartitionerClass(partition.class);

上一篇：MapReduce---＞Map端的join

下一篇：【Android】单选框和多选框

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯