数据仓库系列--维度_李孟_新浪博客
原创
©著作权归作者所有:来自51CTO博客作者Dlimeng的原创作品,请联系作者获取转载授权,否则将追究法律责任
一.简介
在多维分析的商业智能解决方案中,根据事实表和维度表的关系,又可将常见的模型分为星型模型和雪花型模型。在设计逻辑型数据的模型的时候,就应考虑数据是按照星型模型还是雪花型模型进行组织。
当所有维表都直接连接到“ 事实表”上时,整个图解就像星星一样,故将该模型称为星型模型,
星型架构是一种非正规化的结构,多维数据集的每一个维度都直接与事实表相连接,不存在渐变维度,所以数据有一定的冗余。
雪花模型是对星型模型的扩展。它对星型模型的维表进一步层次化,原有的各维表可能被扩展为小的事实表,形成一些局部的 " 层次 " 区域,这些被分解的表都连接到主维度表而不是事实表。
优点是 : 通过最大限度地减少数据存储量以及联合较小的维表来改善查询性能。雪花型结构去除了数据冗余。
总结:
星型模型因为数据的冗余所以很多统计查询不需要做外部的连接,因此一般情况下效率比雪花型模型要高。星型结构不用考虑很多正规化的因素,设计与实现都比较简单。雪花型模型由于去除了冗余,有些统计就需要通过表的联接才能产生,所以效率不一定有星型模型高。正规化也是一种比较复杂的过程,相应的数据库结构设计、数据的 ETL、以及后期的维护都要复杂一些。因此在冗余可以接受的前提下,实际运用中星型模型使用更多,也更有效率。
参考《hadoop 构建数据仓库实践》
上一篇:数据仓库系列--架构
提问和评论都可以,用心的回复会被更多人看到
评论
发布评论
相关文章
-
jvm系列_李孟_新浪博客
url:jvm系列--GCurl:jvm系列--堆分析url:jvm系列--工具url:jvm系列--类加载器url:jvm系列--锁
jvm url java unity3d post -
Hbase原理系列--架构_李孟_新浪博客
体系图:一.写流程1.client向hregionserver发送写请求。2.h
网络 java redis 大数据 hadoop -
Hbase原理系列--成员_李孟_新浪博客
安装url:hbase集群部署一.简介HBASE是一个高可靠性、高性能、面向列、可伸缩
数据库 分布式 网络 大数据 java -
kafka系列--结构01_李孟_新浪博客
整体结构:1.Producer :消息生产者,就是向kafkabroker发消息的客户端。2.Consumer :
队列 kafka java activemq 分布式