一、      什么是数据挖掘

数据挖掘是指从大量数据中提取或“挖掘”知识。数据挖掘是一种“黄金挖掘”,从沙子堆中挖掘出黄金,找出最有价值的黄金,这种有机的价值物提取的过程称为“黄金挖掘”。通过某种手段或者经验丰富人士,从海量的数据中找出有用的“数据”,掌握数据中的重要知识,称之为“知识挖掘”。“知识挖掘“通过演化逐渐转变为“数据挖掘”。知识发现主要通过以下几个过程来实现:

1、数据清理(消除噪音和不一致数据)

2、数据集成(多种数据源可以组合一起)

3、数据选择(从数据库中提取与分析任务相关数据-----需要经验丰富的人员参与)

4、数据变换(数据转换成统一的、适合数据挖掘的数据,主要通过等价数据替换)

5、数据挖掘(使用智能方法来进行自动挖掘,或者人为提取有用数据)

6、模式评估(根据数据的领域情况,研究方向建立合适的数据模式)

7、知识表示(数据文字化的过程,将挖掘的数据进行提炼,转化为实际有价值的东西)

二、      什么激发数据挖掘

近年来,信息化的逐步推进,数据挖掘已经引起信息化产业界和社会市场的

极大关注。数据产业化、信息市场集中化现象逐渐明朗,大型数据仓库和数据库中的数据越来越多。将大量的数据堆进行数据挖掘,形成可以演化数据动态、预测数据变化、推断市场趋势、分析数据偏离等有利的数据,掌握整个数据的市场动态,利用数据来进行市场规划的重要性也逐步显现出来了。