jxaa047264的博客_数据结构与算法,Mysql,大数据,Linux,erlang,集群,操作系统,ML,Program,Linux_51CTO博客

鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 24年11月软考 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

51CTO博客

首页
关注
排行榜
精品课程
免费直播
软考题库

科目全、试题精、讲解专业，扫码免费刷

搜索历史清空

热门搜索

查看【】的结果
写文章
创作中心
登录注册

Mahout使用简例

剖析mahout脚本mahout 位于$MAHOUT_HOME/bin目录下，是所有mahout调用的入口。主要会做各类环境变量的设置。MAHOUT_JAVA_HOME:指定java的执行路劲，会覆盖$JAVA_HOMEMAHOUT_HEAPSIZE :JAVA运行堆栈的内存大小HADOOP_CONF_DIR : hadoop 配置文件路径主要是*-site.xml这些文

Mahout

原创 2013-05-20 10:31:37 950 阅读

老大哥教育新入行的话

做测试和做数据，会有完全不同的思考范畴和方式，你要努力转变，数据是一个朝阳行业给你一个方向，看你敢不敢兴趣，个性化搜索，或者说个性化搜索这个东西怎么做。给你发的那些资料主要是之前搜索在做什么，现在我比较关心的是搜索将来要做什么，以一种怎样的体系化的方法去达到可预期的结果。你可以想想有想法，咱们可以讨论讨论这言下之意是让我去多关注下个性化搜索方面的内容，有

戒言

原创 2013-04-16 09:01:59 548 阅读 1点赞 1评论

Mahout in Action 第四章构建推荐器

在做了之前的推荐计算和推荐数据的表示之后，让我们真正进入到推荐器本身的详细内容中，这才是干货。在Mahout中两种众所周知的推荐算法：基于用户，以及基于商品的推荐器。本章深入讲解背后的理论，以及Mahout中的实现。这两个算法都是依赖于相似度的度量。有很多种定义相似度的方式，本章会具体介绍在Mahout中如何使用你的选择。其中的实现包括Pearson关联，log lik

Mahout

推荐器

翻译精选 2013-04-09 12:22:07 403 阅读

Mahout in Action Chapter 3 推荐数据的表示

推荐结果的质量大部分由数据的数量和质量决定。“进去的是垃圾，出来的一定也是垃圾”在这里再适用不过。拥有高质量的数据是一件好事，一般而言，拥有许多数据也是好的。推荐算法自然是数据密集型的；算法的计算需要访问大量的信息。数据的质量和它的表示方法对运行时的性能有巨大的影响。明智得选择数据结构能提升几个数量级的性能，且在大规模时更是关系重大。

推荐 Mahout

翻译精选 2013-04-08 10:16:33 718 阅读

Mahout in Action(2012)翻译第二章

2.2 创建一个推荐器 2.3 构造一个推荐系统推荐引擎室一个工具，一种回答问题的方法，“对一个用户而言，什么是最好的推荐呢？”在研究答案以前，最好是要先调查下问题。究竟什么才是真正的一个好的推荐引擎？当一个推荐引擎产出时我们怎么才能知道？本章之后的内容主要挖掘怎样构建一个推荐器，因为这在研究特定的推荐系统时会相

数据挖掘

Mahout

原创 2013-04-07 00:12:44 1136 阅读

HashMap的实现原理与开发中的注意细节

最近开发要用到HashMap。所以就抽空看了下HashMap的实现细节以及在开发过程中需要注意的一些小点，特别是并发访问中，HashMap一直是性能瓶颈的罪魁祸首，有许多需要开发者来留意的地方。 HashMap在jdk中是一个链表的闭地址散列结构。因此在高并发的情况下容易引发get与set同时出现的场景，这样就容易导致链表遍历死循环而引发并

java map

原创 2013-04-02 23:49:26 539 阅读