前言:

    4月20日下午,笔者在全球云计算开源峰会进行了题为“金融行业自动化运维的研究与落地”的分享。本次分享的内容是3月份笔者发表的一篇文章的精简和提炼,如已经阅读过之前文章,本文客户略读或忽略。



(PPT分享)全球云计算开源技术峰会上的大卫分享_java

(PPT分享)全球云计算开源技术峰会上的大卫分享_java_02

(PPT分享)全球云计算开源技术峰会上的大卫分享_java_03

我们都知道,金融行业、尤其是银行,信息化的起步较早(1980年左右),大致分为4个阶段:


1.信息孤岛阶段(柜面手工作业电子化)->2.互联互通阶段(电汇取代信汇、电子联行清算系统)->3.银行信息化阶段(数据大集中的完成)->4.信息化银行阶段(互联网金融)。


金融行业的IT系统也是最复杂的。有的银行,目前既有大型机,又有小型机、有X86物理服务器、虚拟化、云平台,甚至在容器方面也进行探索和探究。

正是由于金融行业IT系统较为复杂,因此IT运维方面,存在一些问题和困难。金融行业IT运维现状归结到两方面,主要是:效率低、成本高两方面。

      根据长期在银行业的运维经验,红帽总结了IT运维8个方面的问题。这些问题,有些可能是各位已经遇到过的。

(PPT分享)全球云计算开源技术峰会上的大卫分享_java_04

(PPT分享)全球云计算开源技术峰会上的大卫分享_java_05

参考Gartner IT基础架构和运维成熟度模型中的技术维度,红帽根据在Linux领域长期的经验,提出OS运维成熟度模型。OS运维成熟度越高的企业,其IT架构越敏捷、 Time To Market越短、业务竞争力越强。


而作为对IT运维要求更高的金融行业,显然需将OS运维成熟度至少提升到四级,实现集中化;甚至五级,也就是自动化和运维开发一体化。

 

根据不完全统计,在传统行业里,IT成熟度较高的用户,其OS成熟度大多处于三级,也就是基本实现了运维制度化、规范化,但仍处于半手工运维的阶段。

(PPT分享)全球云计算开源技术峰会上的大卫分享_java_06

IT环境层,指的是自动化运维平台需要纳管的对象。在一个复杂的数据中心中,运维绝不是仅仅针对一种操作系统,或者一种型号的服务器。而是整个数据中心。

 

基础架构管理层

基础架构管理层的职责分为三大块:集中监控、运维自动化平台、内控平台。 

1.集中监控平台包含平台(如虚拟化平台)监控和应用(如oracle数据库)监控。


2.运维自动化平台,它是基础架构管理层的核心组件。它需要完成四类操作:作业调度、自动巡检、批量发布、容灾管理。也就是说,运维自动化平台必须能够驱动IT环境层的七种对象。


3.内控平台,主要负责合规控制。它完成:合规管理、风险管理、用户管理、访问控制。

 

整体而言,在基础架构管理层中,运维自动化平台是最关键的,它是管理层的发动机。而集中监控平台和内控平台则是辅助自动化平台的。前者负责运维自动化的全生命周期管理,后者负责运维自动化平台的合规和安全。

 

服务管理层

服务管理层通常通过ITIL等架构理念,与客户的规章制度与业务流程匹配,需要做定制化开发。目前绝大多数金融行业用户都有流程,只是体现在纸面上。需要做的是将纸面上的流程IT工具化。

 

数据展示层:

主要是面向企业内部IT和非IT部门的内容用户。做统一的门户。过这个统一的平台,内部用户可以访问这个平台。通常情况,运维门户会与客户的云门户统一。

(PPT分享)全球云计算开源技术峰会上的大卫分享_java_07

Ansible Tower作为一款优秀的自动化运维工具,它有四大特点:

  • 使用简单而功能强大(它可以支撑整个IT架构,从物理机、操作系统、虚拟化、云、容器到网络设备。语言简单易学)

  • 操作安全可控(ansible tower基于RBAC方式对用户进行授权,AD,LDAP等认证方式做对接)

  • 适应传统行业客户与互联网行业(ansible是git hub上最受欢迎,使用最广的自动化工具)

  • 在金融行业已经积累了海量的playbook(红帽的的用户可以直接拿来用,红帽在很多金融行业客户积累的经验)。

satellite则在系统部署、订阅管理、软件管理、配置管理四方面帮助客户实现IT运维标准化。

红帽云管平台Cloudforms,可以与AnsibleTower和Satellite对接,实现云平台管理与运维统一。

(PPT分享)全球云计算开源技术峰会上的大卫分享_java_08

(PPT分享)全球云计算开源技术峰会上的大卫分享_java_09

任何一个大型平台,无论是混合云平台,还是自动化运维平台,它们的构建都不是一蹴而就的。都需要客户结合自身的情况,分步骤、分阶段走。

 

下图展示了自动化运维平台常见的几类工作,按照OS运维成熟度模型进行评估,六类工作都能实现自动化的话,IT成熟度可达到接近于5级的水平。

(PPT分享)全球云计算开源技术峰会上的大卫分享_java_10

(PPT分享)全球云计算开源技术峰会上的大卫分享_java_11

(PPT分享)全球云计算开源技术峰会上的大卫分享_java_12

(PPT分享)全球云计算开源技术峰会上的大卫分享_java_13

(PPT分享)全球云计算开源技术峰会上的大卫分享_java_14

(PPT分享)全球云计算开源技术峰会上的大卫分享_java_15