Logo

  • zlw东南风

    发布于:2017-08-31 10:10:03

    5

    一个单词统计的实例,怎样通过MapReduce完成排序?
    假设有一批海量的数据,每个数据都是由26个字母组成的字符串,原始的数据集合是完全无序的,怎样通过MapReduce完成排序工作,使其有序(字典序)呢?对原始的数据进行分割(Split),得到N个不同的数据分块:实例分析:WordCount这个类实现Mapper接口中的map 方法,输入参数中的value 是文本文件中的一行,利用StringTokenizer将这个字符串拆成单词,然后将输出结果&l
    精选文章 337人阅读 评论(0) 收藏(4)
  • 付炜超

    发布于:2017-08-17 00:39:22

    5

    机器学习实战精读--------决策树
    感觉自己像个学走路的孩子,每一步都很吃力和认真!机器根据数据集创建规则,就是机器学习。决策树:从数据集合中提取一系列规则,适用于探索式的知识发现。决策树本质:通过一系列规则对数据进行分类的过程。决策树算法核心:构建精度高,数据规模小的决策树。ID3算法:此算法目的在于减少树的深度,但是忽略了叶子数目的研究。C4.5算法:对ID3进行改进,对于预测变量的缺失值处理、剪枝技术、派生规则等方面作了较大改
    精选文章 772人阅读 评论(0) 收藏(3)
写博文