商业智能的软件工具集合
1)终端用户查询和报告工具
专门用来支持初级用户的原始数据访问,不包括适应于专业人士的成品报告生成工具。
2)数据仓库(Data Warehouse)和数据集市(Data Mart)产品
包括数据转换、管理和存取等方面的预配置软件,通常还包括一些业务模型,如财务分析模型。
3)数据挖掘( Data Mining)软件
使用诸如神经网络、规则归纳等技术,用来发现数据之间的关系,做出基于数据的推断。
4) OLAP工具
(1) OLAP的概念。
OLAP的概念晟早是由关系数据库之父E.F.Codd于1993年提出的,他同时提出了关于OLAP的12条准则。OLAP的提出引起了很大的反响,OLAP作为一类产品同OLTP明显区分开来:OLTP属于传统的关系型数据库的一个主要应用,主要用于基本的、日常的事务处理,例如银行交易:OLAP是数据仓库系统的一个主要应用,支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果。OLAP提供多维数据管理环境,其典型的应用是对商业问题的建模与商业数据分析。OLAP也被称为多维分析。
(2)“维”的概念。
OLAP的目标是满足决策支持或者满足在多维环境下特定的查询和报表需求,它的技术核心是“维”这个概念。
OLAP工具是针对特定问题的联机数据访问与分析。它通道多维的方式对数据进行分析、查询和报表。“维”是人们观察数据的特定角度。通过把一个实体的多项重要的属性定义为多个维(dimension),使用户能对不同维上的数据进行比较。例如,一个企业在考虑产品的销售情况时,通常从时间、地区和产品的不同角度来深入观察产品的销售情况。这里的时间、地区和产品就是维。而这些维的不同组合和所考察的度量指标构成的多维数组则是OLAP分析的基础,可形式化表示为(维1,维2,…,维雅,度量指标),如(地区,时间,产品,…,销售额)。多维分析是指对以多维形式组织起来的数据采取切片( slice)、切块(dice)、钻取(drill-down和roll-up)和旋转(pivot)等各种分析动作,以求剖析数据,使用户能从多个角度、多侧面地观察数据库中的数据,从而深入理解包含在数据中的信息。因此OLAP也可以说是多维数据分析工具的集合。
OLAP的基本多维分析操作有钻取、切片和切块以及靛精、drill across和drill througb等。钻取是改变维的层次,变换分析的粒度。它包括向上钻取和向下钻取。roll up是在某一维上将低层次的细节数据概括到高层次的汇总数据,或者减少雏数:而drill down则相反,它从汇总数据深入到细节数据进行观察或增加新维。
切片和切块是在一部分维上选定值后,关心度量数据在剩余维上的分布。如果剩余的维只有两个,则是切片;如果有三个,则是切块。
旋转是变换维的方向,即在表格中重新安排维的放置(例如行列互换)。
(3) OLAP的实现方法。
OLAP有多种实现方法,根据存储数据的方式不同可以分为ROLAP (RelationalOLAP)、MOLAP(Multidimensional OLAP)和HOLAP (Hybrid OLAP).ROLAP表示基于关系数据库的OLAP实现。以关系数据库为核心,以关系型结构进行多维数据的表示和存储。ROLAP将多维数据库的多维结构划分为两类表:一类是事实表,用来存储数据和维关键字;另一类是维表,即对每个维至少使用一个表来存放维的层次、成员类别等维的描述信息。维表和事实表通过主关键字和外关键字联系在一起,形成了“星型模式”。对于层次复杂的维,为避免冗余数据占用过大的存储空间,可以使用多个表来描述,这种星型模式的扩展称为“雪花模式”。
MOLAP表示基于多维数据组织的OLAP实现。以多维数据组织方式为核心,也就是说,MOLAP使用多维数组存储数据。多维数据在存储中将形成“立方块( Cube)”的结构,在MOLAP中对“立方块”的“旋转”、“切块”和“切片”是产生多维数据报表的主要技术。
HOLAP表示基于混合数据组织的OLAP实现。如低层是关系型酌,高层是多维矩阵型的。这种方式具有更好的灵活性。
还有其他的一些实现OLAP的方法,如提供一个专用的SQL Server,对某些存储模式(如星型、雪片型)提供对SQL查询的特殊支持,等等。
OLAP工具是针对特定问题的联机数据访问与分析。它通过多维的方式对数据进行分析、查询和报表。维是人们观察数据的特定角度。例如,一个企业在考虑产品的销售情况时,通常从时间、地区和产品的不同角度来深入观察产品的销售情况。这里的时问、地区和产品就是维。而这些维的不同组合和所考察的度量指标构成的多维数组则是OLAP分析的基础,可形式化表示为(维1,维2,…,维,l,度量指标),如(地区、时间、产品、销售额)。多维分析是指对以多维形式组织起来的数据采取切片、切块、钻取和旋转等各种分析动作,以求剖析数据,使用户能从多个角度、多侧面地观察数据库中的数据,从而深入理解包含在数据中的信息。
主流的商业智能工具包括BO、COGNOS和BRIO。一些国内的软件工具平台如KCOM ()也集成了一些基本的商业智能工具。