商务智能-数据仓库-数据挖掘
商务智能:是通过对大量的数据进行自动地加工、处理、分析,实现数据向信息,信息向知识的转换,并将知识应用与决策的一系列过程的技术。从某种方面来说,商务智能是一种解决方案。
数据仓库:是一个环境,而不是一件产品,提供用户用于决策支持的当前和历史数据,这些数据在传统的操作型数据库中很难或不能得到。数据仓库技术是为了有效的把操作形数据集成到统一的环境中以提供决策型数据访问的各种技术和模块的总称。
数据挖掘:是一个工具,是一个利用各种分析工具在海量数据中发现模型和数据间关系的过程,这些模型和关系可以用来做出预测。它能够帮助商业人士更深入、更容易的分析数据,在“数据矿山”中找到蕴藏的“知识金块”,帮助企业减少不必要投资的同时提高资金回报。
商务智能(BI)基本体系结构:数据仓库、在线联机分析(OLAP)、数据挖掘。
BI对数据实施的全生命周期管理:数据加工(通过ETL)、数据展现(通过report)、数据分析(OLAP+数据挖掘)。因此,商务智能可以看作是一个解决方案。
三者之间的联系
数据仓库是一种解决方案,是对原始的操作数据进行各种处理并转换成有用信息的处理过程,用户可以通过分析这些信息从而作出策略性的决策。因此,在很多场合,我们也把数据仓库系统称为决策支持系统。而数据挖掘:是建立在数据仓库之上,分析数据仓库的。
商务智能是一种概念,一种目标,
而数据挖掘是实现商务智能的一种途径,一种手段,
其实做数据挖掘就是为了企业决策,也就是商务智能了。
数据仓库的特点与产险的关联
数据仓库的特点是:
1、数据仓库是面向主题的。
所谓主题,是指数据归类的标准,每个主题对应一个客观分析领域。面向主题,就是指数据仓库内的信息是按主题进行组织的,面向主题的数据组织方式是在较高的层次上进行数据抽象,对产险指标体系进行重组,以便能完整、统一地描述宏观决策的分析对象。
eg:
保险:产险中的客户关系信息,客户风险信息,客户价值信息,客户赔付信息等。
2、数据仓库的数据是集成的。
所谓集成,指数据仓库中的信息不是从各个业务处理系统中简单抽取出来的,而是经过系统加工处理的,不同的数据存放在不同的联机数据库中(OLAP),与不同的应用逻辑捆绑在一起,有重复和不一致的地方。系统对收集起来的数据进行抽取、清洗、转换和装载等(ETL)操作,确保数据仓库的信息是关于保险的一致的全局信息。
3、数据仓库的数据是相对稳定的。
数据一旦进入数据仓库,一般情况下将长期保留,并且积累了相当多的历史数据,数据状态在一定时段内相对稳定。因为数据仓库中绝大部分操作是插入和查询操作,修改和删除操作很少。
4、数据仓库的数据是体现数据历史变化的。
数据仓库中的数据一般期限较长,并且包含时间元素。数据仓库内的信息并不只是某一时间点的信息,而是从过去某一时间点到目前的各个阶段的信息,通过这些信息,可以对某些金融指标数据的发展趋势做出定量分析和预测。