1. 什么叫数据仓库?数据仓库的特点? (相信inmon的数据仓库概念的四个特点是最基本的吧,当然需要加上自己的理解) 首先,用于支持决策,面向分析型数据处理,它不同于企业现有的操作型数据库; 其次,对多个异构的数据源有效集成,集成后按照主题进行了重组,并包含历史数据,而且存放在数据仓库中的数据一般不再修改。 数据仓库是一个面向主题的(Subject Oriented)、集成的(Integrate
转载
2023-09-25 08:50:22
157阅读
数据仓库的定义? 首先,用于支持决策,面向分析型数据处理;其次,对多个异构的数据源有效集成,集成后按照主题进行重组,并包含历史数据,而且大数据培训存放在数据仓库中的数据一般不再修改。 数据仓库(Data Warehouse)是一个面向主题的(subject oriented)、集成的(int ...
转载
2021-09-18 14:07:00
239阅读
2评论
想要数据粒度的合理性、模型的灵活性得到保证,并且能够适应未来的信息资源,需要遵守维度建模的一些原则。否则,很容易会遇到数据仓库障碍,并且把用户弄糊涂。在此,大圣众包威客平台将为你提供几个数据仓库维度建模的原则,让你妥妥地避开“陷阱”。 1.原子数据需详细 维度建模应该使用最基础的原子数据进行填充,以支持不可预知的来自用户查询的过滤和分组请求。 用户通常不希望每次只看到一个单一的记录,但是你无
1.某航空公司有M个城市之间的全连通运营线路,最近业务扩张,新增了N(>1)个城市。为了保持其全连通运营的特色,公司新增了58种单程票(往与返各算一种单程票,没有联程票);那么扩张后,该航空公司有()个城市间的运营能力。解析:增加1个城市,则增加M条往返程票;增加2个,则增加M+(M+1)条往返程;增加N个,则增加 M+(M+1)+...+(M+N-1) 条(即29条)往返程;易得 14+1
转载
2024-09-01 18:54:33
61阅读
什么是BI?BI(Business Intelligence)即商务智能,它是一套完整的解决方案,用来将企业中现有的数据(原始数据或商业数据或业务数据等)进行有效的整合,快速准确地提供报表并提出决策依据,帮助企业做出明智的业务经营决策。原始数据记录了企业日常事务,例如与客户交互的信息、财务信息,员工相关记录等等。这些数据可以用于汇报、分析、挖掘、数据质量、交互、预测分析等等
超全面试总结——数据仓库如何理解数仓为什么要数据仓库建模为什么要设计数据分层通用的数据分层设计分层的原则是什么?数据集市和数据仓库的区别数据库和数据仓库有什么区别?维度建模三种模式 星形、雪花、星座事实表事实表设计方法维度表什么是缓慢变化的维度维度表设计方法如何维度建模最常见的三种数据仓库建模体系什么是ETL?常用的ETL工具联机分析处理 OLAPOLAP和OLTP的区别元数据(Metadata
转载
2023-08-08 13:04:54
184阅读
1.什么是数据仓库?如何构建数据仓库?(如果这个问题回答的好,后面很多问题都不需要再问)2.如何建设数据中台?可简单说下理解与思路3.数据仓库、数据中台、数据湖的理解4.传统数仓的程度(建模工具、ETL工具、BI报表工具、调度系统)5.传统数仓和大数据数仓的异同?有哪些大的变化?6.印象最深刻的项目?为什么?亮点与优势?7.数仓最重要的是什么?8.实时数仓做过吗?采用什么架构?lambda有哪些优
转载
2023-12-09 23:43:39
128阅读
所有面试的前奏:先简要的介绍一下自己!这句话基本上是所有面试官问的第一个问题,这个问题我的应对策略是:1. 简要介绍何时毕业于哪所学校(姓名,籍贯可选择) 2. 从近往远介绍开始介绍工作经验 3. 大厂大项目靠前介绍,其他情况靠后 4. 小项目简要介绍一两句话概括 5. 重要介绍和自己面试岗位匹配的项目,并且需要调理分明后续就是按照你上面介绍的项目具体询问各种细节问题,下面罗列一下自己遇到的相关面
转载
2023-08-25 18:40:56
49阅读
1.数仓与关系数据库区别 1.数据库有相对复杂的表格结构,存储结构相对紧致,少冗余数据,而数据仓库则是相对简单的表格结构,存储结构相对松散,多冗余数据。 2.数据库在读和写两方面都有优化,数据仓库一般只是读优化 3.数据库单次操作作用于少量的数据,数据仓库单次操作会作用于大量的数据 4.数据库支持单条数据的修改,数据仓库不支持 5.数据库可以和用户进行交互,数据仓库不行2.数据仓库为什么需要分层?
转载
2023-12-28 05:51:26
86阅读
ETL开发概述ETL是数据仓库的后台,主要包含抽取、清洗、规范化、提交四个步骤,传统数据仓库一般分为四层模型。 分层的作用:1.划分ETL阶段工作重心,便于管理2.降低开发和维护成本3.减少需求变化带来的冲击4.便于数据问题跟踪名词解释:ODS——操作性数据DW——数据仓库DM——数据集市STG层在维度建模阶段已经确定了源系统,而且对源系统进行了数据评估。STG层是根据CDC策略把各个源系统的数
转载
2023-11-09 16:33:42
69阅读
用户问题1.企业内各业务部门的系统之间不是集成的,那些业务主管想让他们的数据进入数据仓库中,而且他们都想马上就能实现。而数据仓库经理只能逐个的满足他们的要求,要避免引起业务主管的愤怒,也要避免他们开发自己的数据仓库,数据仓库经理应该如何来处理这种局面?2.企业的IT部门雇佣了一名咨询人员来开发一个数据仓库,但是该企业的业务部门不支持这个项目。IT部门告诉这名咨询人员继续工作,即使业务部门计划赶他走
转载
2023-09-28 10:24:16
125阅读
数据质量1.一个数据质量分析师正在试图分析一个数据仓库之中数据的质量状况。这个数据仓库的数据量非常的大,数据质量分析师准备用抽样的方式进行分析。但是他不知道需要抽样多少数据,如何抽样,以及如何向用户解释抽样分析的结果是准确的。这位数据质量分析师应该如何来进行工作呢?2.一个电信公司有一个含有14TB数据的数据仓库。这家公司估计到,该数据中有10TB以上的数据可能是冗余的。这家公司没有命名约束,其中
转载
2023-12-27 11:09:08
38阅读
数仓分层介绍
原创
精选
2022-08-28 09:33:24
774阅读
点赞
数据仓库分层
原创
2022-10-30 18:09:23
236阅读
点赞
数据仓库项目管理面试题整理 搜了一下网络上都是一个主题一个网页,自己看了觉得不方便,所以整理到一起放上来方便自己看。本部分内容整理于Sid Adelman的著作Impossible Data Warehouse Situations。其中的问题都是从业人员在工作中经历的实际问题。这些问题同样也可以作为数据仓库项目经理的面试问题。这些问题很多没有固定的答案,不同的人会有不同的想法。重要
转载
2024-01-02 22:09:38
71阅读
最近由于比较多的与新的第三方系统进行各种数据的交互,免不了要把实时的用户表格以及代码表格同步过去,这个时候我们就想说使用比较低成本和简单的方式把我们需要的数据正确的同步到一个中间库中去,然后再由第三方系统通过同样的方式从中间库中取得相关的数据。于是我们就使用上了ETL。ETL,是英文 Extract-Transform-Load 的缩写,用来描述将数据从来源端经过抽取(extract)、转换(t
转载
2023-09-20 15:39:50
87阅读
# 阿里数据仓库面试实现流程
## 目录
- [介绍](#介绍)
- [流程步骤](#流程步骤)
- [代码实现](#代码实现)
- [总结](#总结)
## 介绍
在阿里数据仓库(AliDataWarehouse)的面试中,我们需要展示我们在数据仓库领域的知识和技能。这篇文章将详细介绍如何实现阿里数据仓库面试,包括流程步骤和相应代码实现。
## 流程步骤
以下是阿里数据仓库面试的流程步骤
原创
2023-08-14 16:10:33
137阅读
数据仓库的软件开发生命周期需求工程设计实施和单元测试集成和系统测试操作和维护 传统上,数据仓库项目遵循软件开发生命周期模型的一个变体,称为瀑布模型。虽然文献中有多个版本,各阶段的数量和名称不同,但它们都遵循分阶段的方法。此外,这些模型具有广泛的共同规划,然后是全面的设计、实现和测试。在流程开始时给出用户输入,然后在实施和测试过程中转入技术系统。其中一些分阶段模型允许在过程中回退步骤,例如,如果
转载
2023-06-09 22:18:32
167阅读
安全1.一个企业建立了一个数据仓库系统,用来分析企业的部门及产品相关盈利能力。数据仓库实现不久,项目经理被CFO叫到办公室,被要求解释为什么一位职位低下的金融分析师能够在数据仓库中查看详细的工资记录,这些数据在公司中只有副总裁才可以访问。显然,这个数据仓库中没有建立安全计划。面对这种局面,这家企业怎么才能扭转这种局面呢?2.一位数据仓库咨询人员告诉一家企业,他们必须考虑数据仓库内的安全问题,并应该
转载
2010-08-10 16:54:00
82阅读
# SQL 数据仓库面试:基础知识与实用示例
在数据密集型的今天,数据仓库(Data Warehouse)作为数据存储和分析的核心架构,越来越受到企业的重视。参加 SQL 数据仓库的面试时,候选人需要掌握一些基本概念、常用语法以及数据仓库的设计原则。
## 什么是数据仓库?
数据仓库是一个面向主题、集成的、相对稳定的数据集合,它支持决策支持系统(DSS)的需求。与传统的数据库不同,数据仓库