星型模型和雪花模型

关注 wx5ba7ab4695f27

文章目录

文章目录
星型模型
雪花模型
优点
星型模型和雪花模型的对比
1) 数据优化
2)业务模型
3)性能
4) ETL
总结

星型模型和雪花模型

原创

wx5ba7ab4695f27 2022-02-22 18:38:09 博主文章分类：Hive-大象蜂 ©著作权

文章标签 数据外键主键 文章分类 代码人生

©著作权归作者所有：来自51CTO博客作者wx5ba7ab4695f27的原创作品，请联系作者获取转载授权，否则将追究法律责任

文章目录

星型模型
雪花模型

优点

星型模型和雪花模型的对比

1) 数据优化
2)业务模型
3)性能
4) ETL

总结

在多维分析的商业智能解决方案中,根据事实表和维度表的关系,又可将常见的模型分为星型模型个雪花模型,在设计逻辑型数据的模型的时候，就应考虑数据是按照星型模型还是雪花型模型进行组织。

星型模型

当所有的维表都直接连接到"事实表"上时整个图解就像星星一样,故将该模型称为星型模型

星型模型和雪花模型_外键

星型架构是一种非正规化的结构,多维数据集的每一个维度都直接与事实表相连接,不存在渐变维度,所以数据有一定的冗余,如在地域维度表中,存在国家A省B的城市C以及国家A省B的城市D两条记录,那么国家A和省B的信息分别存储了两次,存在冗余

雪花模型

当一个或多个维表没有直接连接到事实表上,而是通过其他维表连接到事实表上,对应的图解就像多个雪花连接在一起,故称雪花模型,雪花模型是对星型模型的扩展,它是对星型模型的维表进一步层次化,原有的各维表可能被扩展为小的事实表,形成一些局部的"层次"区域,这些被分解的表都连接到主维度表,而不是事实表,如图所示,将地域维表又分解为国家,省份,城市等维表

优点

通过最大限度地减少数据存储量以及联合较少的维表来改善查询性能.,雪花型结构去除了数据冗余

星型模型和雪花模型_数据_02

星型模型因为数据的冗余,所以很多统计查询不需要做外部连接,因此一般情况下效率比雪花模型高

星型结构不用考虑很多正规化的因素，设计与实现都比较简单。雪花型模型由于去除了冗余，有些统计就需要通过表的联接才能产生，所以效率不一定有星型模型高。正规化也是一种比较复杂的过程，相应的数据库结构设计、数据的 ETL、以及后期的维护都要复杂一些。因此在冗余可以接受的前提下，实际运用中星型模型使用更多，也更有效率

星型模型和雪花模型的对比

1) 数据优化

**雪花模型使用的是规范化数据,也就是说数据在数据库内部是组织好的,以便消除冗余,有效的减少数据量,**通过引用完整性,其业务层级和维度都将存储在数据模型之中

星型模型和雪花模型_主键_03

**星型模型使用的是反规范化数据,**在星型模型中,维度直接指的是事实表,业务层级不会通过维度之间的参照完整性来部署

星型模型和雪花模型_数据_04

2)业务模型

主键是一个单独的唯一键(数据属性),特殊数据所选择,Advertiser_ID 就将是一个主键。外键(参考属性)仅仅是一个表中的字段，用来匹配其他维度表中的主键。在我们所引用的例子中，Advertiser_ID 将是 Account_dimension 的一个外键。在雪花模型中，数据模型的业务层级是由一个不同维度表主键-外键的关系来代表的。而在星形模型中，所有必要的维度表在事实表中都只拥有外键。

3)性能

**雪花模型在维度表、事实表之间的连接很多，因此性能方面会比较低。**如果你想要知道 Advertiser 的详细信息，雪花模型就会请求许多信息，比如 Advertiser Name、ID 以及那些广告主和客户表的地址需要连接起来，然后再与事实表连接.

星形模型的连接就少的多，在这个模型中，如果你需要上述信息，你只要将 Advertiser的维度表和事实表连接即可

4) ETL

雪花模型加载数据集市，因此 ETL 操作在设计上更加复杂，而且由于附属模型的限制不能并行化

星形模型加载维度表，不需要再维度之间添加附属模型，因此 ETL 就相对简单，而且可以实现高度的并行化。

总结

雪花模型使的维度分析更加容易,比如"针对特定的广告主,有哪些客户或者公司是在线的?",星型模型用来做指标分析更合适,比如"给定一个客户,他们的收入是多少?"

赞
收藏
评论
分享
举报

上一篇：触发算子和转换算子和优化的三个算子

下一篇：Dubbo环境下Injection of resource dependencies failed; nested exception is org.springframewo错误

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

举报文章

请选择举报类型

内容侵权涉嫌营销内容抄袭违法信息其他

具体原因

包含不真实信息涉及个人隐私

原文链接（必填）

补充说明

0/200

上传截图

格式支持JPEG/PNG/JPG，图片不超过1.9M

已经收到您得举报信息，我们会尽快审核

鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 24年11月软考 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

51CTO博客

首页
关注
排行榜
精品课程
免费直播
软考题库

科目全、试题精、讲解专业，扫码免费刷

搜索历史清空

热门搜索

查看【】的结果
写文章
创作中心
登录注册