最近在搞那个数据治理平台业务架构图如下:
目前主要搞(能力层,Header),数据标准,数据脱敏,
指标中心,系统管理,元数据管理部分。
Header层:只是把系统的代码改了。这块需要基础组件支持。目前不考虑。
数据标准:
一、数据标准的定义
对于企业而言,通俗来讲,数据标准就是对数据的命名、数据类型、长度、业务含义、计算口径、归属部门等,定义一套统一的规范,保证各业务系统对数据的统一理解、对数据定义和使用的一致性。
2、JR/T0105-2014 银行数据标准定义规范[3]:
数据标准是指对数据的表达、格式及定义的一致约定,包括数据 业务属性、 技术属性和 管理属性的统一定义。业务属性包括中文名称、业务定义、业务规则等,技术属性包括数据类型、数据格式等,管理属性包括数据定义者、数据管理者等。
二、数据标准的内容
数据标准管理的对象可以分为 数据模型、 主数据和参考数据、 指标数据三大类,每一类 均可采用以数据元为数据标准制定的基本单元构建数据标准体系。
1、 模型数据标准
基础数据指业务流程中直接产生的,未经过加工和处理的基础业务信息, 模型数据是指对基础类 数据特征的抽象和描述。
模型 数据标准是为了统一企业业务活动相关数据的一致性和准确性,解决业务间数据一致性和数据整合,按照数据标准管理过程制定的数据标准,模型数据标准也是元数据管理的主要内容之一。
以下是某银行[5]为确保数据标准使用,形成的一整套 模型数据标准的信息项属性架构:
2、主数据和参考数据标准[4]
主数据是用来描述企业核心业务实体的数据,比如客户、供应商、员工、产品、物料等;它是具有高业务价值的、可以在企业内跨越各个业务部门被重复使用的数据,被誉为企业的“黄金数据”。
参考数据是用于将其他数据进行分类或目录整编的数据,是规定数据元的域值范围。参照数据一般是有国标可以参照的,固定不变的,或者是用于企业内部数据分类的,基本固定不变的数据。主数据与参照数据的标准化是企业数据标准化的核心。
指标类数据是指具备统计意义的基础类数据,通常由一个或以上的基础数据根据一定的统计规则计算而得到。
指标类数据标准一般分为基础指标标准和计算指标(又称组合指标)标准。基础指标具有特定业务和经济含义,且仅能通过基础类数据加工获得,计算指标通常由两个以上基础指标计算得出。
以下是某银行[6]为确保指标数据标准定义的完整与严谨,形成的一整套指标数据标准的信息项属性架构:
以“拨备覆盖率”指标为例,从数据标准化的角度来看,首先需要定义其业务含义,以明确其定位和用途,统一业务解释;同时通过技术属性明确其指标技术口径和取数规则等,确保指标数据计算结果的一致性。这样,在整个银行层面,统一了“拨备覆盖率”的业务口径和技术口径,最终确立了其使用规范。
指标数据标准可以从 维度、 规则和 基础指标三个方面进行定义:
并非所有 模型数据、 主数据和参考数据、 指标数据都应纳入数据标准的管辖范围。数据标准管辖的数据,通常只需要在各业务条线、各信息系统之间实现共享和交换的数据,以及为满足监控机构、上级主管部门、各级政府部门的数据报送要求而需要的数据。