1.2 虚拟化的各个阶段

我们来看看图1-3中虚拟化的3个阶段,这几个阶段能够带来成功的云计算服务。

1.2.1 第1阶段:IT合理化

用新一代服务器替换高耗能的旧服务器,对基础架构进行合理化(rationalize)。这降低了数据中心的电力消耗和占用空间,其中的某些数据中心已经达到使用寿命。而且,利用vSphere的分布式电源管理(Distributed Power Management,DPM),服务器可以根据群集资源需求关闭或者重启,从而优化电源使用。

1.好处

虚拟化过去常常用在非关键性测试和开发环境中。这样,开发人员能够根据需要使用多种操作系统和应用程序版本。管理员可以在不需要网络或者存储团队的情况下测试生产环境。IT经理在这一阶段中可以虚拟化直接由他们控制的服务器(例如,基础架构服务器),域控制器、打印服务器和Web服务器很容易进行虚拟化。在这一阶段中,基础架构虚拟化渗透率可以达到0%~30%。

数据中心虚拟化技术 数据中心 虚拟化_运维

图1-3 第1阶段以IT服务直接控制的基础架构服务为中心,第2阶段    以业务关键应用程序为中心,第3阶段则关注提供给用户的服务

这一阶段能让各个团队熟悉新环境。利用即时部署(instant provisioning),这些团队能更好地对新需求做出反应,因为新的服务器可以在几分钟内做好准备,而不需要像物理环境那样花费几周,这也同时改进了对用户的服务。

使用快照(snapshot)还可以简单地更新应用程序,因为如果应用程序出现故障,可以快速地回溯。

2.挑战

一般来说,期望从虚拟化技术中得到的成本节约在合理化阶段中还不能实现。确实,在这一阶段必须购买新服务器、存储设备和VMware许可证,还必须培训各个团队。这是一个投资阶段(investment phase)。在这一开始阶段之后,有些管理者得出结论:这种技术不能降低成本。这一点都不奇怪。实际的成本节约发生在下一阶段,那时这种技术已经得到完善并且自动化。之后,成本将得到可观的降低。

在合理化阶段,整合度很低(每个服务器5~10个VM),所以性能问题不明显。大部分问题集中在存储空间。由于部署VM很简单,出现了一种称为虚拟机蔓延(VM sprawl)的现象,这种现象应该得到控制,否则会导致整个环境失控。为了保持控制能力,必须采用严格的VM管理规则。下面是规则的一些例子:
自动关闭(删除)在规定时间内(几个星期)不活跃的VM。

必须识别连续数天处于休眠状态(启动但是没有活动)的VM,以便了解其不活跃的原因。如果这个VM已经被人遗忘,应该关闭并最终删除。

必须识别生产VM并且使其与其他VM分开。例如,可以创建文件夹来分类VM。

1.2.2 第2阶段:关键应用程序

在第2阶段中,提高关键应用程序的服务水平并显著改进操作效率。虚拟化现在可以大规模地部署到信息系统中。工作重心转移,第1阶段的中心是基础架构,而现在的中心是应用程序。关键应用程序的例子包括Microsoft Exchange、Lotus Notes、SAP、Oracle、Microsoft SQL、SharePoint、Citrix和VDI。

  1. 好处

目前,除了少数特殊的应用程序负载之外,大部分关键应用程序在VMware环境中都可以无限制地运行。在vSphere 5中,得益于VM性能的增强,95%的应用程序负载可以在VM中安全地运行。

数据中心虚拟化技术 数据中心 虚拟化_应用程序_02

如图1-4所示,2010年1月~2011年4月间的观察证明,这些应用程序在虚拟化应用程序中运行得很好。注意Microsoft SharePoint在VMware下的高采用率(67%)。

图1-4 大部分传统关键应用程序在VMware中的运行情况
注:研究数据涉及VMware的客户。

  1. 利用复制快速部署应用程序

IT管理员虚拟化Oracle或者SAP的原因之一是:这是复制应用程序的最简单方法。在物理服务器中,复制应用程序的过程是低效率的根源之一。IT管理员必须配置每个应用层,包括硬件、操作系统和应用程序,这很费时且可能造成潜在的配置错误。虚拟化为快速部署创建优化的“黄金映像”,简化了复制过程。而且,应用程序还可以打包成一个vApp,包含多个预先配置了不同应用层(例如,Web、应用程序和数据库)的虚拟机。这个包可以按照需求快速部署到生产(也可以是测试和生产前)用的基础架构中。

3.简化高可用性的实现

在物理环境中,高可用性是很令人头痛的。每个应用程序需要特殊的高可用性方法,这就需要昂贵的许可证、专用的备用基础架构以及配置和管理每个解决方案(Oracle RAC和Data Guard、Microsoft群集、Data Base Mirroring [SQL Server]、Database Availability Group[DAG] Exchange Server…)的熟练人员。使用vSphere技术的标准化方法可以替代这种昂贵的方法,也没有其他技术那么复杂。有些公司利用虚拟化方法,用vSphere HA、vSphere FT或者App-Aware HA(这是一个允许用户插入来自Symantec或者Neverfail的第三方App-Aware产品的API)等集成的高可用性解决方案代替费时的群集解决方案。而且,因为vMotion和Storage vMotion的使用,计划维护操作不再需要中断所涉及的服务,从而提升了服务水平。

4.保证预留资源

在这一阶段中,虚拟化渗透率达到30%~80%。

5.挑战

因为与关键应用程序相关,这一阶段非常敏感。根据2011年7月国际数据公司(IDC)的研究,许多公司发现图1-5中列出的原因降低了它们的部署速度。

数据中心虚拟化技术 数据中心 虚拟化_运维_03


图1-5 可能影响应用程序部署的因素

这一阶段通常需要能够有效地克服技术障碍的方法。这些问题与性能、备份和灾难恢复计划(Disaster Recovery Plan,DRP)相关。这一阶段的挑战在于实现足以支持应用程序负载的目标架构。现有的方法必须加以修改,因为它们通常不适合于虚拟化环境。

有些公司在这种改变上可能面临强大的内部阻力。因此,关键是让所有IT团队尽早加入到项目中来,并在整个转换的过程中给予他们支持。

存储架构也是必不可少的,因为它们是虚拟机的宿主。由于数据量可能非常大,优化数据管理变得很重要。数据压缩、精简配置(thin-provision)和备份重复数据删除都很适合于这些环境。必须考虑虚拟化环境的动态特性,对现有架构进行修改。

对于管理员来说,获得多种技能以及新环境中的培训都是不可或缺的。他们的角色和任务必须演变,最终拥有广阔的视野,很好地理解虚拟技术各个组成部分与数据中心的相互作用。

1.2.3 第3阶段:自动化

在第3阶段中,利用自动化(automation)降低成本。自动化能够节约管理员的时间,使他们能将更多的精力投入到信息系统的更新和改进中。现在,70%的维护和30%的创新这一比例已经颠倒过来。自动化是管理增长和满足每年提出的新要求的关键。自动化拉近了业务需求和计算机资源的距离,不需要求助IT团队,支持创新并提供不受财务问题困扰启动新计划的可能性。确实,许多项目中止的原因都是IT预算的缺乏。

这一阶段还包括过程的工业化和为达到高整合水平的资源优化。这些工作能够证明前两个阶段的投资是正确的。

注意:一个管理员在物理环境中通常能管理50台物理服务器,在虚拟环境中能管理多达200~300个VM,实施自动化之后可以管理多达数千个VM。

因为基础架构问题和应用服务水平在前两个阶段已经解决,考虑到过程的实施和部署自动化,这个阶段可以将重点放在用户需求上。利用服务目录,用户可以独立地消费IT资源而无需依赖大量IT建议或者工作。这就是所谓的IT即服务(IT as a service)。

1.挑战

在第3阶段中,IT团队面对的挑战和过去不同。以前遇到的问题与技术或者基础架构问题相关,例如,维护操作条件、更新平台以及各类迁移(应用程序、硬件、操作系统等)。虚拟化解决方案减少了这些问题,但是公司现在必须面对组织和管理问题。服务器虚拟化对数据中心的所有硬件和软件元素都有影响,必须有合适的管理原则,确定具有决策权的人。

自动化很方便,但是VM绝不是自由的。采用严格的规则并定义一个VM管理策略绝对有必要。如果建立了成本分摊制度,就有必要定义制度的标准(例如,按照消耗量或者VM数量)。

VM生命周期管理(VM lifecycle management)的各个方面在确定哪个VM可以删除以及哪个VM必须保留和存档(按照法律规定)时,都是必须考虑的。

2.迈向云计算

虚拟化的第3阶段(也就是最后一个阶段)也是引入云计算的一个阶段。云计算是一个广泛的主题,需要单独的一本书来介绍,所以这里不作详细说明。

云计算的定义多种多样,下面是来自NIST(美国国家标准和技术学会)的一个有趣的定义:

云计算是一种可以在最小的管理投入或者服务提供商交互的情况下快速部署和发布的计算模型,能够提供对一个可配置计算资源池(例如,网络、服务器、存储、应用和服务)的普遍、方便、按需的网络访问。

实际上,云计算是利用计算资源的一种新方式,目标是通过提供全自动计算服务,降低IT基础架构的复杂度。
在这个模型中,信息系统从一个成本中心变成一个利润中心,可用的资源可以通过订阅或者收费服务重新计算。用户通过提供服务目录的一个网关来消费计算资源。从技术上和财务上讲,虚拟化技术的出现使得人们可以不考虑物理组件,从而使这种新模型成为可能。

云计算模型的主要好处是激活的速度和提供的敏捷性,它能快速地做出反应,满足公司的业务需求。使用可用的服务,几乎可以立刻创建各种项目,这改变了日常的工作方法。

这种模型的主要问题之一涉及对数据所处位置和所有权的理解。这是云服务供应商的问题,它们必须解释数据所在的位置,以及规范是否能够有效地服从于购买此类服务的国家或者团体的法律和规定。数据流向和所有权必须以容易理解的方式编写文档并接受各方的验证。

在企业内部创建的云称为私有云(private cloud)。由外部供应商(服务提供商,service provider)提供的服务称为公共云(public cloud)。在发生私有云无法满足的活动激增时,可以在规定时间内分配来自公共云的附加资源,这称作混合云(hybrid cloud)。

公共云是外部提供商(服务提供商)向最终用户提供的服务。提供商和客户在最低性能或者交付时间上达成一致,这称作服务水平协议(Service-Level Agreement,SLA)。客户不再需要管理内部IT基础架构,可以将重点放在核心业务上,因此这种模型最适合于中小型企业(Small and Medium Business,SMB),在这种企业中IT通常不是核心。服务水平(通常是每周7天每天24小时具有DPR、备份等)和安全水平提供的用户体验好于大部分SMB目前的水平,主要是因为内部能力和财务方法的相关问题。运营成本明显低于内部解决方案,而且用户总是能够访问最新的软件版本。加之,计算资源变得灵活,它们能够适应活动量的波动和季节性特征。

云计算存在多种模型,包括:

软件即服务(Software as a Service,SaaS):用户对底层基础架构没有控制权。他们直接使用在云中找到的应用程序。例如:Mozy、Zimbra、Gmail、Google Apps、Microsoft Office 365、Cisco WebEx)。

平台即服务(Platform as a Service,PaaS):用户用编程语言或者服务提供商提供的工具,部署他们创建或者购买的应用程序。他们不控制底层基础架构。例如,SpringSource、Microsoft Azure。

基础架构即服务(Infrastructure as a Service,IaaS):用户自己部署处理器、内存、网络和存储等资源。他们保留对操作系统和应用程序的控制。例如,EMC、VMware、Cisco、Amazon Web Services、IBM、CSC、Verizon)。