wget http://mirrors.ustc.edu.cn/apache/mahout/0.8/mahout-distribution-0.8.tar.gztar -xzvf mahout-distribution-0.8.tar.gzcd mahout-distribution-0.8sudo vi增加:    expor
原创 2023-05-12 16:28:48
74阅读
# 教你如何实现“Mahout Python” ## 一、整体流程 首先,让我们来看一下实现“Mahout Python”的整体流程。在这个过程中,我们将会使用Mahout工具来进行机器学习操作,并通过Python进行代码编写和执行。 ### 流程步骤: ```mermaid gantt title 实现“Mahout Python”流程 section 准备工作
原创 2024-05-04 03:42:47
57阅读
Mahout学习——Canopy Clustering      聚类是机器学习里很重要的一类方法,基本原则是将“性质相似”(这里就有相似的标准问题,比如是基于概率分布模型的相似性又或是基于距离的相似性)的对象尽可能的放在一个Cluster中而不同Cluster中对象尽可能不相似。对聚类算法而言,有三座大山需要爬过去:(1)、a large num
转载 精选 2014-11-01 00:24:37
511阅读
一、Mahout简介查了Mahout的中文意思——驭象的人,再看看Mahout的logo,好吧,想和小黄象happy地玩耍,得顺便陪陪这位驭象人耍耍了...附logo:(就是他,骑在象头上的那个Mahout)步入正文啦: Mahout是一个很强大的数据挖掘工具,是一个分布式机器学习算法的集合,包...
转载 2015-01-18 12:29:00
227阅读
2评论
一、Mahout简介 查了Mahout的中文意思——驭象的人,再看看Mahout的logo,好吧,想和小黄象happy地玩耍,得顺便陪陪这位驭象人耍耍了... 附logo: (就是他,骑在象头上的那个Mahout) 步入正文啦: Mahout 是一个很强大的数据挖掘工具,是一个分布式机器学习算法的集
转载 2016-06-21 09:52:00
196阅读
2评论
Mahout学习路线图主要介绍Hadoop家族产品,常用的项目包括Hadoop, Hive, Pig, HBase, Sqoop, Mahout, Zookeeper, Avro, Ambari, Chukwa,新增加的项目包括,YARN, Hcatalog, Oozie, Cassandra, Hama, Whirr, Flume, Bigtop, Crunch, Hue等。从2011年开始,
转载 2014-02-20 17:50:00
99阅读
2评论
Mahout学习路线图​​Hadoop家族系列文章​​,主要介绍Hadoop家族产品,常用的项目包括Hadoop, Hive, Pig, HBase, Sqoop, Mahout, Zookeeper, Avro, Ambari, Chukwa,新增加的项目包括,YARN, Hcatalog, Oozie, Cassandra, Hama, Whirr, Flume, Bigtop, Crunc
转载 2014-01-13 16:20:00
86阅读
2评论
Mahout实现的机器学习算法见下表 算法类 算法名 中文名 分类算法 Logistic Regression 逻辑回归 Bayesian 贝叶斯 SVM 支持向量机 Perceptron 感知器算法 Neural Network 神经网络 Random Forests 随机森林 Restrict
原创 2021-07-27 14:37:15
171阅读
实验环境:shiyanlou CentOS6.6 64 JDK:1.7.0_55 64 Hadoop:1.1.2简介Mahout是Apache旗下的一个开源项
原创 2017-04-19 08:37:54
205阅读
转载请注明出处:http://blog.csdn.net/gamer_gyt 博主微博:http://weibo.com/234654758 Github:https://github.com/thinkgamer 参考: 从源代码剖析Mahout推荐引擎 mahout 推荐系统示例 Mahout
转载 2019-12-31 16:20:00
255阅读
2评论
preface 运行自带的例子来进行测试 第1章 使用kmeans算法实例 (1)http://archive.ics.uci.edu/ml/databases/synthetic_control/synthetic_control.data点击链接,下载数据集synthetic_control.data。将数据集synthetic_control.data放到MAHOUT_HOME目录下面
原创 2023-07-24 18:06:59
137阅读
一、Mahout简单介绍查了Mahout的中文意思——驭象的人,再看看Mahout的logo,好吧,想和小黄象happy地玩耍,得顺便陪陪这位驭象人耍耍了...附logo:(就是他,骑在象头上的那个Mahout)步入正文啦: Mahout是一个非常强大的数据挖掘工具,是一个分布式机器学习算法的集...
转载 2014-06-01 19:08:00
199阅读
2评论
.mat就是matlab的文件格式,一般用于matlab和python间的数据传输,python中numpy和scipy提供了一些函数,可以很好的对.mat文件的数据进行读写和处理。在python中可以使用scipy.io中的函数loadmat()读取mat文件,函数savemat保存文件。1、读取文件如上例:#coding:UTF-8 import scipy.io as scio dataFi
mat文件数据格式是MATLAB数据存储的标准格式。python中可以使用scipy.io.loadmat()函数,读取mat数据文件; 用savemat(filePath, content)函数将content需要存储的内容保存到指定的路径下。注意io.loadmat()读出来的数据data是dictionary类型; io.savemat()也是以字典形式保存的。import scipy.io
转载 2023-06-29 20:06:31
36阅读
关于推荐引擎 如今的互联网中,无论是电子商务还是社交网络,对数据挖掘的需求都越来越大了,而推荐引擎正是数据挖掘完美体现;通过分析用户历史行为,将他可能喜欢内容推送给他,能产生相当好的用户体验,这就是推荐引擎。 推荐算法Slope one的原理 首先Slope on...
转载 2013-11-13 09:47:00
130阅读
2评论
Mahour 包括协同过滤,基于User和Item的推荐;kmeans、Fuzzy-kmeans 、Mean shift 、Dirichlet process 、LDA聚类;奇异值分解;并行频繁项集挖掘;补充的贝叶
原创 2023-03-22 16:01:28
160阅读
1.Hbase+k-means (G级别) 2.k-means+mr (T级别) 1. 2.canopy 2.贝叶斯算法 决策,分类,文档分类 3.推荐系统 4.图书推荐系统 1.需求 付完款的用户90%都要回到购物车看看自己买的东西是否少买/多买 猜你喜欢 购买组合 内部推荐系统测试jps查询
原创 2021-07-29 10:41:27
593阅读
http://www.cnblogs.com/jerome-rong/archive/2012/05/22/2512947.html
转载 精选 2013-05-21 10:55:34
643阅读
mahout的安装,简单到不能再简单的安装过程
原创 2015-10-22 10:30:24
684阅读
一、Mahout简介       Mahout 是一个很强大的数据挖掘工具,是一个分布式机器学习算法的集合,包括:被称为Taste的分布式协同过滤的实现、分类、聚类等。Mahout最大的优点就是基于hadoop实现,把很多以前运行于单机上的算法,转化为了MapReduce模式,这样大大提升了算法可处理的数据量和处理性能。 在Mahout
原创 2016-10-31 21:00:30
948阅读
  • 1
  • 2
  • 3
  • 4
  • 5