1.数据仓库的基本概念

数据仓库,英文名称为Data Warehouse,可简写为DW或DWH。数据仓库的目的是构建面向分析的集成化数据环境,为企业提供决策支持。它出于分析性报告和决策支持目的而创建。

数据仓库最大特征: 本身并不“生产”任何数据,也不需要“消费”任何的数据,数据来源于外部,并且开放给外部应用,这也是为什么叫“仓库”,而不叫“工厂”的原因。

2.数据仓库的主要特征

  • 面向主题的(Subject-Oriented ): 主要指分析的目标
  • 集成的(Integrated): 数据来源于各个数据源,将各个数据源的数据集中放置在一起
  • 非易失的(Non-Volatile): 由于存储的过去的既定发生的数据,这些数据一般不允许出现变更
  • 时变的(Time-Variant ): 对着时间的推移,原方案无法满足未来的需求,此时需求变更,同时数据也会出现新增操作

3.数据仓库与数据库区别

  • 数据库: 操作型处理,叫联机事务处理OLTP(On-Line Transaction Processing), 面向于事务(业务),用于捕获数据,要求延迟性比较低,数据构建尽量避免冗余.
  • 数据仓库:分析型处理,叫联机分析处理OLAP(On-Line Analytical Processing), 面向于主题(分析),储存过去既定发生的历史数据,对延迟性无要求,允许出现冗余.