编 辑:理哥
彭友们!我是老彭。明天就要上考场了,祝各位彭友CDGA考试顺利,60分万岁!
理哥也在备考,他可认真了!读懂他的这篇文章,最少提3分!废话不多说,赶紧看文章~~~
一、 前言
元数据是描述数据的数据,主要作用是让数据相关方了解数据如何生产、如何定义、如何分布,如何演变,数据之间有什么关系,以及相互之间的影响。DMBOK2第12章是元数据管理,看这一章语境图时有两个疑问。
二、 问题思考
第一个疑问是技术元数据中第14点“恢复和备份规则”和操作元数据中第8点“备份、保留、创建日期、灾备恢复预案”中的备份有什么区别?怎么理解?
元数据可以分为三类,业务元数据,技术元数据和操作元数据。
从实战角度,我们实现一个产品都需要经过业务需求,技术实现,产品运维和使用这三个步骤,分别对应需求方,实现方和产品运维和使用方,这是最核心的理解思路,用这个思路理解,语境图中两个备份就比较清晰了:
我们用上面三个角度看三类元数据的例子,边界是不是清晰多了?不过下面ETL作业详细信息放在技术元数据中,清洗标准放在操作元数据中有点不太好理解,不知道作者是怎么思考的?欢迎留言探讨。
业务需求/需求方 | 产品开发/实现方 | 产品运维和使用/操作方 |
业务元数据 | 技术元数据 | 操作元数据 |
数据集、表和字段的定义和描述 | 物理数据库表名和字段名 | 批处理程序的作业执行日志 |
业务规则、转换规则、计算公式和推导公式 | 字段属性 | 抽取历史和结果 |
数据模型 | 数据库对象的属性 | 调度异常处理 |
数据质量规则和检核结果。 | 访问权限 | 审计、平衡、控制度量的结果 |
数据溯源和数据血缘 | 数据CRUD(增、删、改、查)规则 | 错误日志 |
数据标准 | 物理数据模型,包括数据表名、键和索引 | 报表和查询的访问模式、频率和执行时间 |
特定的数据元素记录系统。 | 记录数据模型与实物资产之间的关系 | 补丁和版本的维护计划和执行情况,以及当前的补丁级别 |
有效值约束 | 数据血缘文档,包括上游和下游变更影响的信息 | 数据归档、保留规则和相关归档文件 |
利益相关方联系信息 | 文件格式模式定义 | 服务水平协议(SLA)要求和规定 |
数据的安全/隐私级别 | 源到目标的映射文档 | 容量和使用模式 |
已知的数据问题 | 恢复和备份规则 | 备份、保留、创建日期、灾备恢复预案 |
数据使用说明 | ETL作业详细信息 | 清洗标准 |
第二个问题是语境图中输入为什么有过程元数据而实际详解中却找不到?是多写了,还是有其它的理解? 欢迎大家留言探讨。
三、 结语
上面是我对元数据的一些思考,希望对您有启发,您是从哪个角度理解的?欢迎留言探讨或加我微信,我们一起学习,思考数据治理理论,一起持续完善数据治理体系。
排版 | 老彭
审校 主编 | 理哥