大家好,我是大D。 这篇文章跟大家一起聊下数仓中比较容易混淆的两个概念——数据域、主题域。有的公司对
大家好,我是大D。这篇文章跟大家一起聊下数仓中比较容易混淆的两个概念——数据域、主题域。有的公司对二者的界限并不明显,都统一称为数据域或者主题域;也有的公司两者是区分开使用的,那么数据域和主题域有什么区别呢,根据自身工作经验,聊下自己的见解。数据域数据域
转载
2023-05-23 10:52:07
234阅读
主题域划分方法
数据建模主题域的分类方法通常基于主题域的复杂度和组织结构的层次性。以下是常见的分类方法:
单一级别分类法(Flat classification):将整个主题域的全部数据映射至同一个层次结构中。此方法简单易懂,但难以处理大型主题域。
多级别分类法(Hierarchical classification):将主题域的数据分为不同的层次结构,例如客户层次、订单层次等。此方法可以更灵
原创
精选
2023-03-29 22:40:42
1766阅读
数据仓库主题域
在当今数据驱动的商业环境中,数据仓库作为企业数据整合和分析的核心,具有不可或缺的地位。然而,构建和维护数据仓库的过程中往往会面临多种技术痛点,特别是在主题域管理上。主题域的有效设计和优化不仅影响数据仓库的性能,也直接影响业务决策的效率。以下是对我在解决数据仓库主题域问题过程的详细记录。
在初始阶段,我们遇到的技术痛点主要体现在以下几个方面:
1. 数据源繁杂,数据格式不一致,
数仓主题是什么数据仓库主题是指透过“上帝视角”将企业不同业务流程信息进行汇总、分类然后对其进行分析利用的一个抽象化的概念。也是指企业中某一分析领域具体的分析对象,这样一来,每一个数仓分析领域都有一个数仓主题相呼应。分析对象是一个较为主观的选择过程,说它主观是因为不同的企业有不同的业务重心,没有办法统一分析得出一个普遍适用的结论。但这也让数据仓库的主题类型拥有了更多可能性,分析活动也变得更加灵活,具
转载
2023-10-11 15:34:09
200阅读
一、前言数据仓库具有面向主题的特性,那么就会有主题的概念,数仓建设是遵循纵向分层开发,横向划分主题域设计,数仓分层就不在这次谈了,这次我会结合本人数仓工作实践总结的经验来聊聊数仓主题域划分,同时会引申出主题划分,和数据域是什么,业务过程等。这个对于大数据数仓工程师来说是必备的能力,比如当你面临着一个新业务的开启,需要从0到1开始搭建数据仓库或者数据集市,这时候就要考虑到主题域和主题的合理划分。当然
转载
2023-08-28 17:31:08
314阅读
文章目录主题的概念主题域的获取主题边界确定主题的内容主题的使用 主题的概念主题(Subject)是在较高层次上将企业信息系统中的数据进行综合、归类和分析利用的一个抽象概念,每一个主题基本对应一个宏观的分析领域。在逻辑意义上,它是对应企业中某一宏观分析领域所涉及的分析对象。例如“销售分析”就是一个分析领域,因此这个数据仓库应用的主题就是“销售分析”。 面向主题的数据组织方式,就是在较高层次上对分析
转载
2023-08-27 21:35:11
139阅读
大家好,我是大D。这篇文章跟大家一起聊下数仓中比较容易混淆的两个概念——数据域、主题域。有的公司对二者的界限并不明显,都统一称为数据域或者主题域;也有的公司两者是区分开使用的,那么数据域和主题域有什么区别呢,根据自身工作经验,聊下自己的见解。数据域数据域是指面向业务分析,将业务过程或者维度进行抽象的集合。它是以业务系统的角度,对业务过程进行归纳,抽象出来的数据域。业务过程可以概括为一个个不可拆分的
# 理解数据仓库主题域与业务活动主题的关系
在当今数据驱动的时代,数据仓库扮演着关键的角色,以支持企业的分析和报表需求。对于刚入行的小白而言,理解“数据仓库主题域、业务活动与主题之间的关系”是非常重要的。本文将通过一个流程图和关系图,系统地讲解如何构建这些关系,还将提供代码示例,以便于理解。
## 一、流程概述
在开始之前,让我们先了解构建数据仓库主题域与业务活动主题的基本流程。以下是一个简
设计数据仓库数据仓库基础笔记思维导图已经整理完毕,完整连接为:数据仓库基础知识笔记思维导图 建造数据仓库只要包含两个部分的工作:与操作型系统接口的设计数据仓库本身的设计数据仓库需求只有在已经装载部分数据并开始使用时才能弄清楚 数据仓库是在启发方式下建造的从操作型数据开始集成性能数据从操作型环境到数据仓库时要经历时基变化1对数据仓库中已有的以及要传入的数据规模进行管理数据在抽取和进入数据仓库时要进行
转载
2024-09-15 18:41:57
62阅读
本次讨论的主题是: 数据仓库中的主题域是如何划分的?问题:
你在工作中和交流中,有主题域划分的例子可以分享吗?
分析:
本话题是一个发散性的话题,并没有限制太多的内容,主要是想跟大家讨论一下在工作和交流中大家都是怎么划分主题域的。关于主题: 数据仓库中的数据是面向主题组织的,主题是在较高层次上将企业信息系统中的数据进行综合、归类和分析利用的一个抽象概念,每一
转载
2023-11-01 21:25:03
48阅读
结合我实际工作中的数据仓库逻辑区域划分客户提供的txt文件为source数据库中raw,cvt表为stagingfact表和dimension表为ODS(Operational Data Store)MSOLAP中建立好的cube和dimension以后为BaseLine或者DataMart数据仓库逻辑区域***Source System(源业务系统) -- Staging Area(暂存区) -
转载
2023-11-06 20:14:35
58阅读
我用这一道面试题,难住了3个面试者!
原创
2022-06-01 16:54:07
420阅读
什么是指标?指标,是用于衡量事物发展程度的单位或方法,也常被称作度量,通常情况下也是报表统计的字段,例如:人口数、营业收入、用户数、利润率、成功率、失败率、覆盖率等。//1数仓指标的构成❖ 数据域数据域是统一数仓层的顶层划分,是一个较高层次的数据归类标准,是对企业业务过程进行抽象、提炼、组合的集合,面向业务分析,一个数据域对应一个宏观分析领域,比如采购域、供应链域、HR域等。数据域是抽象、提炼出来
转载
2024-09-01 10:32:56
33阅读
数据仓库-简介数据仓库定义建立数据仓库的原因为什么不直接访问业务系统用于数据分析使用数据仓库的好处操作型系统与分析型系统操作型系统分析型系统操作型系统和分析型系统对比 数据仓库定义20世纪80年代,IBM研究人员开发出“商业数据仓库”。 本质上,数据仓库试图提供一种从操作型系统到决策支持环境的数据流架构模型。数据仓库之父Bill Inmon在1991年出版的Building the data w
转载
2023-08-11 16:32:56
108阅读
1.主题的概念主题(Subject)是在较高层次上将企业信息系统中的数据进行综合、归类和分析利用的一个抽象概念,每一个主题基本对应一个宏观的分析领域。在逻辑意义上,它是对应企业中某一宏观分析领域所涉及的分析对象。例如“销售分析”就是一个分析领域,因此这个数据仓库应用的主题就是“销售分析”。面向主题的数据组织方式,就是在较高层次上对分析对象数据的一个完整并且一致的描述,能刻画各个分析对象所涉
转载
2023-11-27 16:19:40
162阅读
什么是数据仓库数据仓库试图提供一种从操作型系统到决策支持环境的数据流架构模型。处理过程收集、清洗、整合来自多个数据源的数据。数据仓库描述:一个面向主题的、集成的、随时间变化的、非易失的数据集合。面向主题:数据仓库是面向主题的。主题是一个抽象概念,简单地说就是与业务相关的数据的类别,每一个主题基本对应一个宏观的分析领域。主题域是对某个主题进行分析后确定的主题的边界;集成:集成的概念与面向主题是密切相
转载
2023-11-06 22:52:38
65阅读
定义及特点数据仓库(Data Warehouse,简称DW)是面向主题的、集成的、稳定的、反映历史变化的数据集合。面向主题主题是业务数据特点的一种抽象表达,一般从主题名称字面意思即可大致了解主题下数据的业务意义。常见主题如客户主题,其下实体有客户基本信息、客户资产信息等等。集成包括数据的集成及编码规则的集成。数据仓库中的数据通常来自于各不同源业务应用系统,在入数据仓库时,这些数据可能被集成。另外,
转载
2023-11-02 21:07:27
196阅读
一、数据仓库 关于数据仓库概念的标准定义业内认可度比较高的,是由数据仓库之父比尔·恩门(Bill Inmon)在1991年出版的“Building the Data Warehouse”(《建立数据仓库》)一书中所提出: 中文定义:数据仓库是一个面向主题的、集成的、相对稳定的、反
转载
2023-09-28 14:16:30
105阅读
还在纠结数据域和主题域的区别?
转载
2022-10-21 10:51:11
153阅读
一、前言 分布式数据仓库模型的架构设计,受分布式技术的影响,很多有自己特色的地方,但是在概念模型和逻辑模型设计方面,还是有很多可以从传统数据仓库模型进行借鉴的地方。NCR FS-LDM数据模型是金融行业事实上的工业标准。也是各行业数据仓库模型的基础和蓝本。本文以NCR FS-LDM10.0版本为基础,介绍NCR FS-LDM主题域模型的划
转载
2023-11-30 15:34:16
120阅读