数据库是面向事务的,数据仓库是面向主题的。

数据库一般存储在线交易数据,数据仓库一般存储历史数据。

数据库设计是尽量避免冗余,一般采用范式规则设计,数据仓库设计有意引入冗余,采用反范式设计。

数据库是为获取数据设计,数据仓库是为分析数据设计,数据仓库两个基本的元素是维表和事实表。

数据库通常更关注业务交易处理(OLTP),数据仓库更关注数据分析层面(OLAP)。

数据库比较流行的有Oracle、MYSQL、SqlServer等,数据仓库比较流行的有Greenplum、Hive、Teradata等。

下面概念是摘自百度百科,

数据仓库:英文名称为Data Warehouse,简称DW,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。数据仓库中的特点在于面向主题、集成性、稳定性和时间特性。

  • 面向主题:OLTP数据库的数据组织面向事务处理任务,而数据仓库的数据是按照一定的主题进行组织。
  • 集成性:数据仓库的数据有来自于分散的操作型数据,通过ETL将数据从原始数据中抽取出来,进行加工与集成,统一与综合后才能进入数据仓库。
  • 稳定性:数据仓库中的数据主要提供企业决策分析之用,主要操作是数据查询分析,修改和删除操作很少,通常只需要定期的加载、刷新。
  • 时间特性:传统的关系型数据库存储的数据一般是当前值,反映当前信息,而数据仓库是供分析决定使用的,不但需要当前数据,也需要历史数据,数据仓库中的数据结构一般都包含时间特性。

数据库:英文名为Database,是按照数据结构来组织、存储和管理数据的建立在计算机存储设备上的仓库。数据库中的数据指的是以一定的数据模型组织、描述和存储在一起、具有尽可能小的冗余度,较高的数据独立性和易扩展性的特点并可在一定范围内为多个用户共享。
这种数据集合具有如下特点:尽可能不重复,以最优方式为某个特定组织的多种应用服务,其数据结构独立于使用它的应用程序,对数据的增、删、改、查由统一软件进行管理和控制。