数据管理组织架构与职责 数据管理部门职责_数据


数据操作管理是提供从数据获取到数据清理的全过程支持,关联图:


数据管理组织架构与职责 数据管理部门职责_数据库_02


一、概念

数据操作管理是结构化数据的开发、维护和支持活动。包括两个职能:数据库支持和数据技术管理。数据管理员(DBA)在该活动中起着重要的作用。

数据操作管理的目标:

  • 保护和确保结构化数据资产的完整性;
  • 管理数据在其生命周期内的可用性;
  • 优化数据库事务性能;

二、数据库支持

数据库支持由DBA完成,DBA分为开发DBA和产品DBA。开发DBA关注开发活动,产品DBA关注实施数据操作管理活动。因此,数据库支持更准确的说是由产品DBA完成的。

DBA的数据库支持工作主要包括:

1、创建产品数据库环境、配置环境

管理工作包括:

  • 安装、更新DBMS以及其他相关数据技术工具;
  • 管理数据库的连通性,包括为相关操作用户提供技术指导和服务支持;
  • 划分适当空间,优化不同存储技术不同种类的数据;
  • 与其他工作人员合作调整与DBMS协作的操作系统、网络和事务处理中间层的性能;

可以准备一份清单,列出上述工作的步骤,建立数据库管理机制和工作流程。这样DBA可以有效的实施管理和控制,将应用程序的数据库修改实施到质控环境和产品环境中,加强环境管理。

DBA是所有数据库修改的监管人,其他人员只能提出修改请求,由DBA定义准确的修改方案,并实施和控制更改。

2、数据采集管理:获取来自外部的数据

外部数据可能是许可的,也可能是免费的。它们以不同的格式一次性、或通过订阅服务定期更新。数据采集的管理需要把数据订阅服务职责交给数据分析人士。

  • 数据分析师把外部数据源记录在逻辑数据模型和数据辞典内;
  • 开发人员据此设计并外部数据的读取程序;
  • DBA负责将数据加载到数据库中,供其他程序使用;

3、规划数据恢复

数据治理委员会与IT数据管理部门建立数据可用性及恢复的服务水平协议。协议设定数据可用性期望,允许进行数据库维护和备份时间,设定不同场景下的数据恢复期望时间,包括潜在的灾难事件等。

DBA保证制定的所有计划(数据库、数据库服务器恢复),要覆盖所有导致数据丢失、损坏的可能场景。

管理层和组织的业务连续性管理部门(如果存在)应该评审并批准数据恢复规划。所有的计划可以被DBA访问。DBA备份所有恢复计划联同所有相关软件,以及有关安装、DBMS配置说明、安全码等应存放于除现场外的安全地方,以备灾难发生时应用。数据库备份亦同样处理。

4、备份和恢复数据

DBA定期备份数据库、OLTP数据库和数据库事务日志。在数据库服务水平协议中定义备份频率。DBA需要对数据的重要性和保护数据所需付出的代价(存储资源空间)之间做出权衡。每个数据库每天至少要进行一次完全备份。

同时,数据库的存储区域需要根据数据的情况进行设置,并根据数据更新频率和数据量来设置数据备份策略、日志数据转储策略等内容。以便可以提供更好的数据保护,并减少备份对服务器资源以及程序带来的影响和冲击。

对于重要数据或者业务应用场景要求高的,还需要考虑数据库发生事故时的切换,以保障应用服务的继续运行。根据需要设置切换的方案,包括其他数据保护选项,比如服务器集群,热备份等。必要时,DBA也需要负责通过重新加载必要的数据库和事务日志备份最大可能的恢复丢失的数据或损坏的数据。

提供恰当的保护机制,可确保数据的持续可用性、完整性、可恢复性,安全性。

5、设定数据库性能服务水平

数据库的性能服务水平有两方面:可用性和性能。性能是以可用性做为前提的。数据服务管理部门与数据所有人之间通过服务水平协议定义数据库的性能期望。一般来说,协议中规定了数据库的可用性时间和有选择的几个应用程序事务(复杂查询和更新的组合),在确定的可用性时间范围内指定最大允许执行时间。

可用性是系统或数据库能提供正常生产工作的时间百分比。

以下4个因素影响数据库的可用性:

  • 可管理性:产生可维护有效环境的能力;
  • 可恢复性:发生中断时重建服务的能力,更正不可预料事件发生所导致错误的能力;
  • 可靠性:在规定时期内提供指定服务水平的能力;
  • 可服务性:确定问题所在、诊断错误原因以及修复和解决问题的能力;

很多因素都有可能导致数据库丧失可用性。DBA的责任是采取有效措施保证数据库在线运行正常。(P99页列举了可能导致数据库不可用的因素)

6、监控并调整数据库性能

通过监控数据库性能和问题,DBA可以主动或被动的优化数据库性能。根据DBMS提供性能监听功能,生成分析报告。DBA应当保存不同时期和版本的报告,以便进行新旧对比分析,通过报告中数据的发展趋势,来分析是否出现了问题,也有助于分析哪些问题是伴随时间推移而产生的。

书中列举了大量可能导致性能低下的原因(P100),可重点关注这些方面,并有针对性的采取相应措施,改善数据库性能。但是需要注意的是,反范式化只能在其他行动无效后方可使用,并且在使用时仔细考虑其可能导致的其他后果。

7、规划数据留存方案

不是所有的数据都会永远存留的主存储器上,所以物理数据库设计的一个重要部分是数据的留存规划。不再有效支持应用程序处理的数据应当归档并转移到次存储器上,对于废弃、无用的数据也需要定期进行清理。

数据库设计期间就需要与数据的所有者讨论数据保留问题,并达成数据有效期内如何使用数据的协议。

数据管理的主要原则之一就是维护数据的代价永远不应该超过这些数据带给组织的价值。

8、归档、留存和清除数据

DBA应当同应用开发人员以及其操作人员合作实施已经批准的数据留存规划。对副存储区、数据库作业周期以及清理规则进行设置。

9、支持专用数据库

特殊情况下可以使用特殊类型的数据库,并进行专用的数据库管理。在支持特殊数据库管理上,DBA负责确保定期备份数据库,执行数据库恢复测试。这个并不存在管理难度,核心是如果要将这个特殊的数据库上的数据融合到其他的一个或多个关系数据库中时,数据整合是极具挑战性的工作。所以组织在购买数据库时应进行充分的考虑和讨论,并给出妥善的解决方案。

三、数据技术管理

DBA需要理解数据技术需求,在了解数据技术原理,并且能够知道数据技术在怎样的情况下提供有效价值。

选择数据技术的出发点:

  • 解决的问题是什么?
  • 提供其他数据技术没有的功能吗?
  • 没有而其他数据技术可提供的功能?
  • 是否需要特殊硬件要求?
  • 是否有特别的操作系统需求?
  • 需要特殊的软件才能获得该数据技术所宣称的功能?
  • 是否有特殊的存储需求?
  • 对网络或连接有特殊需求?
  • 是否包括数据安全功能?
  • 是否需要特殊技能来支持?是否需要从外面引进人才?

数据技术管理是对数据管理过程中需要的各类工具进行管理。包括:数据库软件、数据库管理及辅助工作工具、数据建模和模型管理软件、智能分析软件、数据整合工具、数据质量和清理工具、元数据管理软件、虚拟化工具,以及涉及到版本管理、故障处理、测试等方面的工具。

数据技术管理工作包括:

  • 定义数据技术架构
  • 评估数据技术
  • 安装和管理数据技术
  • 备案和跟踪数据技术的使用许可
  • 支持数据技术的使用和问题

培训是做到有效地理解和应用各种技术的关键。企业应该针对每个参与实施人员、支持人员、使用数据人员、数据库技术人员制定有效的培训计划和预算。

四、数据操作管理的指导原则

实施数据操作管理的指导原则:(参考Craig Mullins编著的《数据库管理》)

  • 记录所有事件;
  • 保留所有记录;
  • 尽可能程序自动化处理;
  • 集中理解每个任务的目的,管理范围,简化事情,一次做一件事;
  • 三思而后行;
  • 沉着冷静,避免更多错误;
  • 不仅了解技术,也要了解业务;
  • 相互协作,提供帮助,彼此评审,共享知识;
  • 利用所有资源;
  • 持续更新;

五、过程总结

详见链接:

DAMA数据管理各职能总结note.youdao.com

六、组织和文化的影响

企业往往从应用的角度去看待数据,安全的、可再利用的、高质量的数据所带来的的长期价值以及“将数据视为企业资源”的观点,通常还不被企业认可和重视。

DBA与组织内的其他角色,通常处于对立状态,对技术的改变适应慢。可以通过一些方法和策略来促进更有效的合作方式,满足企业数据和信息需求。了解谁是利益相关者,需求是什么?设立一套清晰、简洁、实际、以业务为中心的标准,传播和实施这些标准,为利益相关者提供最大的价值,以达到最佳的效果。

组织可以依据实际情况设置DBA的数量和区分DBA的类型,比如应用DBA、过程DBA等。