6请画出数据挖掘系统的体系结构

关注 mob64ca14048514

文章目录

第一章概述
1.1 背景
1.2 基本概念
1.3 数据挖掘发展历史
1.4 主要功能
1.5 知识发现的过程
1.6 数据挖掘与其他学科的关系
1.7数据挖掘的应用
1.8 未来趋势

6请画出数据挖掘系统的体系结构

转载

mob64ca14048514 2024-07-15 06:44:01

文章标签 6请画出数据挖掘系统的体系结构数据挖掘人工智能数据知识发现 文章分类 数据挖掘人工智能

第一章概述

1.1 背景

数据爆炸性增长
数据的收集和数据的可获得性
数据挖掘：海量数据的自动分析技术

1.2 基本概念

6请画出数据挖掘系统的体系结构_人工智能

1.2.1 数据

数据是指对客观事件进行记录并可以鉴别的符号,是对客观事物的性质、状态以及相互关系等进行记载的物理符号或这些物理符号的组合。
数据可能存储在数据库、数据仓库和其他信息资料库中。
类型

连续型:数值
离散型:标称二元
符号字符

存在问题:

不一致错误缺失

1.2.2 信息

信息是具有时效性的，有一定含义的，有逻辑的、经过加工处理的、对决策有价值的数据流。

1.2.3 知识

人们实践经验的结晶且为新的实践所证实的；是关于事物运动的状态和状态变化的规律；是对信息加工提炼所获得的抽象化产物。
知识的形式可能是模式、关联、变化、异常以及其他有意义的结构。
知识：把有关信息关联在一起所形成的信息结构。
知识反映了客观世界中事物之间的关系，不同事物或者相同事物间的不同关系形成了不同的知识。

1.2.4 智慧

是人类基于已有的知识，针对物质世界运动过程中产生的问题根据获得的信息进行分析、对比、演绎找出解决方案的能力。
这种能力运用的结果是将信息的有价值部分挖掘出来并使之成为知识架构的一部分。

1.2.5 三者关系

数据经过处理和加工，变成了信息。信息之间产生了联系，形成了知识。通过现有知识，发现了一些知识之间的新关系，并且串联起来，形成了智慧。

1.2.6 数据挖掘的定义

数据挖掘（Data Mining)是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中，提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。

数据源是真实的。数据挖掘(数据融合、数据分析和决策支持)。

数据挖掘其实是一类深层次的数据分析方法。

传统数据分析方法与数据挖掘的区别

海量数据
高维数据
数据的高度复杂性、非结构化的
噪声数据

1.3 数据挖掘发展历史

1989年,出现**知识发现(KDD)**这一术语。
最初，数据挖掘是作为KDD中利用算法处理数据的一个步骤，其后逐渐演变成KDD的同义词。

1.4 主要功能

关联分析

从一个项目集中发现关联规则，该规则显示了给定数据集中经常一起出现的属性－值条件元组。

分类

通过分析一个类别已知的数据集的特征来建立一组模型，该模型可用以预测类别未知的数据项的类别。

回归

预测的不是类别，而是一个连续的数值。

聚类分析

无监督分类,指把一组数据分成不同的“簇”,类内相似度大,类间相似度小。

离群点分析

离群点：一些与数据的一般行为或模型不一致的孤立数据

时间序列分析

时间序列分析即预测（Prediction）

1.5 知识发现的过程

6请画出数据挖掘系统的体系结构_6请画出数据挖掘系统的体系结构_02

知识发现的过程

数据清理 $6请画出数据挖掘系统的体系结构_数据挖掘_03$ 数据集成 $6请画出数据挖掘系统的体系结构_数据挖掘_03$ 数据选择 $6请画出数据挖掘系统的体系结构_数据挖掘_03$ 数据变换 $6请画出数据挖掘系统的体系结构_数据挖掘_03$ 数据挖掘 $6请画出数据挖掘系统的体系结构_数据挖掘_03$ 模式评估 $6请画出数据挖掘系统的体系结构_数据挖掘_03$ 知识表示

6请画出数据挖掘系统的体系结构_数据挖掘_09

数据预处理

净化推测转换数据缩减

1.6 数据挖掘与其他学科的关系

数据挖掘可以认为是数据库技术与机器学习的交叉

1.7数据挖掘的应用

1.8 未来趋势

第一章完

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

赞
收藏
评论
分享
举报

上一篇：查看TortoiseSVN 版本

下一篇：java string 第n次出现

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

举报文章

请选择举报类型

内容侵权涉嫌营销内容抄袭违法信息其他

具体原因

包含不真实信息涉及个人隐私

原文链接（必填）

补充说明

0/200

上传截图

格式支持JPEG/PNG/JPG，图片不超过1.9M

已经收到您得举报信息，我们会尽快审核

鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 24年11月软考 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

51CTO博客

首页
关注
排行榜
精品课程
免费直播
软考题库

科目全、试题精、讲解专业，扫码免费刷

搜索历史清空

热门搜索

查看【】的结果
写文章
创作中心
登录注册