一、为什么要分层1)把复杂问题简单化: 将复杂的任务分解成多层来完成,每一层只处理简单的任务,方便定位问题。2)减少重复计算:规范数据分层,通过的中间层数据,能够减少极大的重复计算,增加一次计算结果的复用性。3)隔离原始数据:不论是数据的异常还是数据的敏感性,使真实数据与统计数据解耦开。二、如何分层ODS层1)保持数据原貌不做任何修改。2)对数据采用压缩,减少磁盘空间3)创建分区表,防止
转载 2023-08-13 17:58:47
94阅读
1 分层实现数据仓库一般分为三层,自上而下分别为数据贴源层(ODS,Operation Data Store)、数据公共层(CDM,Common Data Model)和数据应用层(ADS,Application Data Service)。1.1 ODS层(数据贴源层)贴源层,与业务库保持一致,不做任何处理1.2 CDM层(数据公共层)数据公共层CDM(Common Data Model,又称通
转载 2023-06-05 20:03:16
848阅读
数据仓库(二)数据仓库架构分层一、数据仓库架构数据仓库标准上可以分为四层:ODS(临时存储层)、PDW(数据仓库层)、DM(数据集市层)、APP(应用层)。 1)ODS层:为临时存储层,是接口数据的临时存储区域,为后一步的数据处理做准备。一般来说ODS层的数据和源系统的数据是同构的,主要目的是简化后续数据加工处理的工作。从数据粒度上来说ODS层的数据粒度是最细的。ODS层的表通常包括两类
转载 2023-05-23 14:04:17
117阅读
ive居多。 ODS
转载 2019-10-22 11:42:00
181阅读
2评论
目录数据分层通用的数据分层设计一、数据运营层:ODS(Operational Data Store)二、数据仓库层:DW(Data Warehouse)1. 数据明细层:DWD(Data Warehouse Detail)2. 数据中间层:DWM(Data WareHouse Middle)3. 数据服务层:DWS(Data WareHouse Servce)三、数据应用层:APP(Applica
分层实现   数据仓库一般分为三层,自上而下分别为数据贴源层(ODS,Operation Data Store)、数据公共层(CDM,Common Data Model)和数据应用层(ADS,Application Data Service)。 1ODS层       贴源层,与业务库保持一致,不做任何处
一 为什么要对数据仓库分层? (1)用空间换时间,通过大量的预处理来提升应用系统的用户体验(效率),因此数据仓库会存在大量冗余的数据; (2)如果不分层的话,如果源业务系统的业务规则发生变化将会影响整个数据清洗过程,工作量巨大; (3)通过数据分层管理可以简化数据清洗的过程,因为把原来一步的工作分到了多个步骤去完成,相当于把一个复杂的工作拆成了多个简单的工作,把一个大的黑盒变成了一个白盒,每一层的
分层思想和标准 数据从的特点是本身不生产数据,也不最终消费数据。按照数据流入流出数仓的过程进行分层就显得水到渠成。 每个企业根据自己的业务需求可以分成不同的层次。但是最基础的分层思想,理论上分为三个层:操作型数据层(ODS)、数据仓库层(DW)和数据应用层(DA)。 企业在实际运用中可以基于这个基础 ...
转载 2021-09-05 21:35:00
619阅读
2评论
分层思想和标准 数据从的特点是本身不生产数据,也不最终消费数据。按照数据流入流出数仓的过程进行分层就显得水到渠成。 每个企业根据自己的业务需求可以分成不同的层次。但是最基础的分层思想,理论上分为三个层:操作型数据层(ODS)、数据仓库层(DW)和数据应用层(DA)。 企业在实际运用中可以基于这个基础 ...
转载 2021-09-05 21:35:00
742阅读
2评论
  概述    数仓分层数据仓库设计中十分重要的一个环节,优秀的分层设计能够让整个数据体系更容易理解和使用  数据分层的作用    我们需要一套行之有效的数据组织和管理方法来让我们的数据体系更有序,这就是数据分层数据分层的好处有清晰数据结构:每一个数据分层都有它的作用域和职责,在使用表的时候能更方便地定位和理解减少重复开发:规范数据分层,开发一些通用的中间层数据,能减少极大的重复计算统一数据
转载 2023-06-07 14:34:59
172阅读
数据仓库分层架构数据分层每个企业根据自己的业务需求可以分成不同的层次,但是最基础的分层思想,理论上数据分为三个层,数据运营层、数据仓库层和数据服务层。基于这个基础分层之上添加新的层次,来满足不同的业务需求。数据运营层(ODS)Operate data store,操作数据存储,是最接近数据源中数据的一层,数据源中的数据,经过抽取、洗净、传输,也就说传说中的ETL之后,装入本层。本层的数据,总体上大
(一)写在前面的话数据仓库中,我们常听到要做分层计算,包括ads、dwd、dws、ads、dim,那为什么要这么区分,有什么意义?今天就来好好讲述一下。(二)传统意义上的数据分成在2012年前后,早期的大数据平台是以Hadoop为核心,数据开发也是以MapReduce为主,Hive等sql类开发极少应用。因此当数据从多个源头采集上来之后,格式化便成为了原始数据。原始数据经过MR的开发之后,生成了各
数据数据仓库分层架构实现流程 在介绍如何实现大数据数据仓库分层架构之前,我们先来了解一下整个实现流程。下面是一个包含各个步骤的示意表格: | 步骤 | 描述 | | ---- | ---- | | 步骤一 | 数据采集 | | 步骤二 | 数据清洗 | | 步骤三 | 数据集成 | | 步骤四 | 数据存储 | | 步骤五 | 数据处理 | | 步骤六 | 数据查询 | | 步骤七 | 数据
为什么要对数据仓库进行分层自从大数据平台hadoop及其技术火起来之后,无论是政企、民企还是各类金融机构,都掀起了一股大数据技术转型、数据仓库重构、智能数据分析、AI 等一系列黑科技且高大上的热潮。其实,是否转型大数据技术以后,产品营销、风险管控、数据分析、管理决策等企业核心诉求都可以应有尽有呢?企业的数据管理核心——数据仓库又应该以何种形态来建设?要回答上述问题,必须要从理解数据仓库的本质与架构
为什么要分层分层的主要原因是在管理数据的时候,能对数据有一个更加清晰的掌控,详细来讲,主要有下面几个原因:数据结构清晰,每一个数据分层都有它的作用域,这样我们在使用表的时候能更方便地定位和理解。方便数据血缘追踪,简单来说,我们最终给业务呈现的是一个能直接使用业务表,但是它的来源有很多,如果有一张来源表出问题了,我们希望能够快速准确地定位到问题,并清楚它的危害范围。减少重复开发,规范数据分层,开发
上一篇开了个头,从Kimball数据仓库生命周期方法角度,列出了数据仓库搭建的核心步骤,从这一篇开始将讲述技术路径:技术架构设计和产品选择和安装。首先先以某公司的数据仓库的总体架构图的视角,了解整个数据仓库搭建起来后结构大体的样子。   最底层是数据源,一般是在线的数据库或者是文件系统。对于在线数据库,一般是操作型数据库,比如mysql,oracle等,一般是存在主库和从库,从
如何分层结合Inmon和Kimball的集线器式和总线式的数据仓库的优点,分层为ODS【-MID】-DW-DM-OLAP/OLAM/appODS层是将OLTP数据通过ETL同步到数据仓库来作为数据仓库最基础的数据来源。在这个过程中,数据经过了一定的清洗,比如字段的统一,脏数据的去除等,但是数据的粒度是不会变化的。ODS层的数据可以只保留一定的时间。MID中间层是采用Inmon集线器架构的方式,使用
数据仓库分层数据仓库的特征在于面向主题、集成性、稳定性和时变性,用于支持管理决策。数据仓库存在的意义在于对企业的所有数据进行汇总,为企业各个部门提供统一的、规范的数据出口。数据仓库在构建过程中通常都需要进行分层处理。业务不同,分层的技术处理手段也不同。数仓分层的主要原因:通过数据预处理提高效率,因为预处理,所以会存在冗余数据如果不分层而业务系统的业务规则发生变化,就会影响整个数据清洗过程,工作量
数据仓库分层如何理解数仓为什么要设计数据分层通用的数据分层设计每层之间的界限又是什么?数据集市和数据仓库的区别数据库和数据仓库有什么区别? 如何理解数仓数据仓库就是整合多个数据源的历史数据进行细粒度的、多维度的分析,帮助高层管理者或者业务分析员做出决策。数据仓库是一个面向主题的、集成的、随时间变化的、但信息本身相对稳定的数据集合,用于对管理决策过程的支持。为什么要设计数据分层需要一套行之有效的数
我们在数仓项目的时候往往是需要将它分层的,但是为什么分层你真正的了解过吗,那它分层的好处又是什么呢。好我们今天就针对这个话题进行讲解,点赞,点赞,点赞 重要事情说三遍。
推荐 原创 2021-01-03 21:31:46
6985阅读
1点赞
  • 1
  • 2
  • 3
  • 4
  • 5