一、数据架构与数据模型
在数据资产化浪潮汹涌而来的时候,数据平台,数据中台,数据湖等平台也成为了企业的数据资产化建设的的‘基建项目’,数据模型是这个基建项目的核心内容之一,贯穿了整个数据架构。
数据模型定义了操作者、行为以及管理业务处理流程的规则,并将定义内容用人们和应用程序都能理解的标准语法进行描述。
- 不同技术背景和业务经验的各类人员在讨论数据需求时缺少一种有效的沟通工具,在讨论中经常因为对各种符号理解不一致,导致沟通效率低下,不同观点之间很难协调,达成共识。
- 当系统出现故障或发现数据问题时,没有可以观察系统的整体视角,技术人员对当前数据库内的状况全然不知,导致系统问题排查困难,数据问题无从下手。
- 不同部门对业务规则的理解不一致,关于“客户”、“产品”等关键概念含义多种多样,数据库中同名不同义,同义不同名现象随处可见,极大地影响了数据的识别和应用。
数据模型作为不同技术背景和业务经验的各类人员有效沟通数据需求的重要媒介,可以帮助描述与沟通数据需求、增加数据的精确性与易用性、降低系统的维护成本并增加数据可重用性。
数据模型是现实世界数据特征的抽象,用于描述一组数据的概念和定义。数据模型从抽象层次上描述了数据的静态特征、动态行为和约束条件。数据模型所描述的内容有三部分:数据结构、数据操作(其中ER图数据模型中无数据操作)和数据约束,形成数据结构的基本蓝图,也是企业数据资产的战略地图。数据模型按不同的应用层次分成概念数据模型、逻辑数据模型、物理数据模型三种类型。
- 概念模型:是一种面向用户、面向客观世界的模型,主要用来描述现实世界的概念化结构,与具体的数据库管理系统(DBMS,Database Management System)无关;
- 逻辑模型:是一种以概念模型的框架为基础,根据业务条线、业务事项、业务流程、业务场景的需要,设计的面向业务实现的数据模型。逻辑模型可用于指导在不同的DBMS系统中实现。逻辑数据模型包括网状数据模型、层次数据模型等;
- 物理模型:是一种面向计算机物理表示的模型,描述了数据在储存介质上的组织结构。物理模型的设计应基于逻辑模型的成果,以保证实现业务需求。它不但与具体的DBMS有关,而且还与操作系统和硬件有关,同时考虑系统性能的相关要求。
数据模型管理是指在信息系统设计时,参考业务模型,使用标准化用语、单词等数据要素来设计企业数据模型,并在信息系统建设和运行维护过程中,严格按照数据模型管理制度,审核和管理新建数据模型,数据模型的标准化管理和统一管控,有利于指导企业数据整合,提高信息系统数据质量。数据模型管理包括对数据模型的设计、数据模型和数据标准词典的同步、数据模型审核发布、数据模型差异对比、版本管理等。数据模型管理的关键活动包括:
二、数据建模工具如何选?
一款优秀的数据建模工具,应该包括ER模型设计,多人协作建模,行业模型组件及模型管控。ER模型设计包括对逻辑模型、物理模型的ER图设计,数据库正向/逆向工具必须能够生成DDL脚本与数据库无缝集成。
- 高效易用 轻松建模 让数据具有更强的可读性
支持丰富的数据源连接,以及可视化的ETL工具帮助企业进行多样数据整合,并通过智能的字段名称转义和关联手段,让数据具有更强的可读性。
- 支持主流数据库
支持Oracle、SQLServer、DB2、MySQL、MariaDB、MongoDB Hive等主流数据库。支持进行数据库逆向工程,并可导入ERMaster、PowerDesigner、Erwin等建模工具文件,支持导出Excel格式的数据字典。
- 可视化建模,便捷操作
支持逻辑模型和物理模型,具备可视化建模能力,可创建多个数据主题,快速编辑表、字段、主外键索引、视图等对象,支持产生Create DDL和Alter DDL语句。
- 管控数据标准,命名标准和数据库规范
统一管理和维护数据标准,模型创建时,智能推荐数据标准,提高数据标准覆盖率,支持自定义数据标准来共同建设公开数据标准,统一企业参考数据管理将企业代码库和数据标准进行关联。
支持自定义,统一管理和维护商业命名词典,对表和字段进行命名标准化,可以自动翻译中文到英文,支持自定义来扩展业务词典、自定义数据类型支持对常用的数据类型进行自定义。
- 多人协作建模
DDM模型库支持对数据模型集中在线存储,版本支持多分支,多版本模型管理,具有创建,删除和封存全生命周期管理能力,多人共同编辑同一个模型,支持版本冲突自动合并,DDM Portal支持模型的数据标准应用情况分析,数据模型规范检查,数据质量报告等功能。
- 模型企业级共享共建
DDM Portal可以查看发布的数据模型和数据之间关系,可视化视图,数据标准应用情况还可以查看数据标准,业务人员方便参与 数据标准的定义,制定业务规则。
- 系统集成
DDM支持集成AD用户,支持邮件通知,支持对接第三方数据地图平台和元数据系统,支持导入Excel、PDM、Erwin等模型文件在线升级更新,易于维护。
结语
要根治数据治理,就应该在一开始的设计态时,就按照数据管理的要求来做。而数语科技的Datablau新一代数据治理平台就可以兼顾到事前,事中,事后,平台由Datablau DDM数据建模产品、Datablau DAM数据资产管理平台、Datablau Data Catalog数据资产目录服务平台三大部分组成,全部拥有软件著作权和知识产权,一站式全面满足中国企业的数据治理需求。其中数据建模产品DDM是Datablau填补国内空白的重量级产品,帮助中国客户摆脱国外产品的垄断现状。通过这个平台,企业能够真正数据资产开放给不同的业务部门,让不同的业务部门能够参与进来,共同发挥数据的价值。
数据治理平台未来将会向智能化,自动化方向进一步发展,智能化技术在数据治理方面将会得到更大范围的应用。而数语科技也将会在未来将人工智能技术更多到融合到自身的产品中,同时,数语科技未来将会在DDM数据建模方面继续深耕,提高开发人员的效率,也会为企业提供通用的行业模板,使得用户可以通过行业模板快速进行模型设计,其次,在DDC数据资产目录服务方面,加深与关系发现、知识图谱的关联,从而能够进一步让业务相关人员把数据资产平台用起来,使得企业能够快速享受到数据为它们带来的红利。