http://irwenqiang.iteye.com/blog/1308834#bc2281931
bc
原创 2023-04-21 06:05:52
107阅读
​最常用的组件(components)是:l  Instances 你的数据l  Filter 对数据的预处理l  Classifiers/Clusterer 被建立在预处理的数据上,分类/聚类l  Evaluating 评价classifier/clustererl  Attribute selection 去除数据中不相关的属性ARFF文件3.5.5和3.4.X版本从ARFF文件中读取是一个很
转载 2013-04-03 10:21:00
155阅读
Weka系统汇集了最前沿的机器学习算法和数据预处理工具,以便用户能够快速灵活地将已有的据处理方法应用于新的数据集。它为数据挖掘的整个过程提供全面的支持,包括准备输入数据、统计评估学习方案、输入数据和学习效果的可视化.Weka除了提供大量学习算法之外,还提供了适应范围很广的预处理工具...
转载 2015-09-17 10:55:00
245阅读
2评论
概述:WEKA是由新西兰怀卡托大学开发的开源项目。WEKA是由JAVA编写的,并且限制在GNU通用公众证书的条件下发布,可以运行在所有的操作系统中。WEKA工作平台包含能处理所有标准数据挖掘问题的方法:回归、分类、聚类、关联规则挖掘以及属性选择。作为数据挖掘爱好者自然要对WEKA的源代码进行分析并以及改进,努力写出自己的数据挖掘算法。下面着重介绍一下如何利用WEKA编写新的数据挖掘算法:注意:WEKA的版本有两个版本:稳定版(STABLE)和开发版(DEVELOP),不同WEKA版本与不同JDK的版本匹配,稳定版WEKA3-4的与JDK1.4.2匹配,而开发版WEKA3-5与JDK1.5匹配,
转载 2013-03-26 18:26:00
210阅读
2评论
WEKA( developed at the University of Waikato in New Zealand 新西兰怀卡托大学)http://www.cs.waikato.ac.nz/~ml/weka/index.html与此开源项目对应的书为《Data Mining Practical...
转载 2009-12-02 17:03:00
292阅读
2评论
在java项目中导入weka.jar的包,然后把下面代码copy到main里面, 用eclipse的话自动import吧. 注意一下那个文件的路径是否正确. import java.io.File; import weka.classifiers.Classifier; import weka.classifiers.trees.J48; impor
原创 2023-05-10 08:27:36
103阅读
首先简单介绍一下wekaWeka是基于java,用于数据挖掘和知识分析一个平台。来自世界各地的java爱好者们都可以把自己的算法放在这个平台上,然后从海量数据中发掘其背后隐藏的种种标准化的算法。当然,也可以编写你自己的算法!  这时窗体上已经给出这个数据集的一些基本
转载 精选 2008-12-19 21:26:03
3131阅读
从前年開始使用weka最数据挖掘方面的研究,到如今有一年半的时间了。看到我们同组的兄弟写了关于weka方面的总结。我也想整理一下。由于网上的资料实在是太少。记得刚接手的时候,真是硬着头皮看代码。只是到如今看来,也积累了非常多的代码了。希望可以在这里跟大家分享一下学习weka的乐趣与经验。Weka是来...
转载 2015-06-09 12:34:00
200阅读
weka平台界面简介纵向排列的四个主要功能1.探索(写自己的代码)2.实验(比较算法)3.可视化4.命令行1.探索先将weka-src.jar文件解压到一个文件夹将文件夹导入到Elipse项目中。按以上提示运行可进入weka主界面2.实验按英文说明
转载 2014-04-01 22:04:00
132阅读
2评论
关联规则挖掘 (一) Apriori (二) FilteredAssociator (三) FPGrowth (四) GeneralizedSequentislPatterns (五) PredictiveApriori (六) Tertius Cluster (一) ...
转载 2013-11-09 15:30:00
512阅读
2评论
一款实用的数据挖掘软件。
原创 2022-10-14 14:55:57
596阅读
Weka LibSVM (WLSVM): Integrating LibSVM into Weka Environment Weka and LibSVM are two efficient software tools for building SVM classifiers. Each one of these two tools has its points of strength
原创 2023-05-10 09:19:59
183阅读
package weka.filters.unsupervised.attribute;PrincipalComponents属性:/** The data to transform analyse/transform. */ protected Instances m_TrainInstances; /** Keep a copy for the class attribute (if
转载 2013-11-11 13:48:00
118阅读
2评论
基础知识:数据挖掘:将大量数据转变为有实际意义的模式和规则,分为两种:直接的和间接的数据挖掘的最终目标就是要创建一个模型,这个模型可改进您解读现有数据和将来数据的方式。数据挖掘的核心就是将正确的模型应用于数据。第一种技术是回归,用来基于其他的示例数据预测一个数值输出(比如房屋价值)。第二种技术是分类(即分类树或决策树),用来创建一个实际的分支树来预测某个未知数据点的输出值。第三种技术是群集,可用它
原创 2016-05-17 13:55:13
1608阅读
maven依赖包dependency> groupId>nz.ac.waikato.cms.wekagroupIroupId>com.google.guavagroupId> art
原创 2023-07-10 20:38:10
79阅读
每一行代表一条数据,用逗号分开属性,最后一列为分类标签将后缀名改为csv,用excel打
原创 2023-07-11 00:02:34
66阅读
用eclipse连接集群查看文件信息提示9000port拒绝连接的错误 Cannot connect to the Map/Reduce location: hadoop1.0.3 Call to ubuntu/192.168.1.111:9000 failed on connection exception: java.net.ConnectException: 拒绝连接1.
转载 2023-09-14 08:20:04
216阅读
第一次写Blog。数据库(NoSql),现在想使用Hadoop对数据库的数据进行处理,涉及到数据库的连接,及相关的CRUD操作。所以,要实现一个Hadoop连接器。类似于Mongodb,连接到数据库,需要先得到数据库对象db,然后得到数据库的collectionSpace,再得到collection,然后,就可以进行数据的读取与写入操作。元数据都是用BSON/JSON结构。下面进入Hadoop
转载 2024-07-30 15:43:21
54阅读
最近公司让我搭建64位的集群,我重新编译了一下hadoop的源码,并部署环境。在这个过程中遇到了一些问题:问题1:hdfs-site.xml文件的配置问题,在配置 <property> <name>dfs.namenode.name.dir</name> <value>file:///home/grid/
转载 2023-07-12 11:34:04
75阅读
 在服务器上搭建了hadoop的伪分布式环境。大神的博客上是使用eclipse来调试,但是我入门以来一直用的是idea,eclipse已经不习惯,于是便摸索着配置了idea远程调试hadoop的环境。步骤一:下载与服务器上的hadoop同版本的hadoop安装包,我下载的是hadoop-2.7.7.tar.gz,下载后解压到某个目录,比如D:\Software\hadoop-2.7.7,
转载 2023-07-12 11:34:19
93阅读
  • 1
  • 2
  • 3
  • 4
  • 5