软件定义数据中心是最近一两年来非常热门的话题,软件定义数据中心一般可以分为软件定义服务器、软件定义存储、软件定义网络等。

使用软件定义数据中心可以极大减化数据中心的部署以及日常管理,同时可以提供资源分布式调整、虚拟机快速部署、虚拟机高可用、虚拟机冗余等多种高级特性。

在企业级虚拟化市场上,VMware公司可以提供软件定义数据中心的完整产品线,从vSphere、VSAN、NSX、vACT等。经过不断的探索改进,VMware vSphere 6.0作为一套成熟的虚拟化解决方案通过整合数据中心服务器、灵活调配置资源等降低运营成本,并且可在不增加成本的情况下提供高可用性、灾难恢复等高级特性。

1.1 传统数据中心介绍

数据中心(DataCenter,简称为DC),给人的第一印象就是存放数据的计算机中心,由服务器、交换等多种设备的组成。如果在“数据中心”前不加特别的说明,一般来说指的是传统数据中心。

1.1.1 传统数据中心的概念

什么是数据中心,维基百科给出的定义是“数据中心是一整套复杂的设施。它不仅仅包括计算机系统和其它与之配套的设备(例如通信和存储系统),还包含冗余的数据通信连接、环境控制设备、监控设备以及各种安全装置”。谷歌在其发布的《The Datacenter as a Computer》一书中,将数据中心解释为“多功能的建筑物,能容纳多个服务器以及通信设备。这些设备被放置在一起是因为它们具有相同的对环境的要求以及物理安全上的需求,并且这样放置便于维护,而并不仅仅是一些服务器的集合”。

1.1.2 传统数据中心面临的问题

传统数据中心正在消耗大量的能源、空间和成本,而且消耗量日益膨胀。在一篇研究报告中称,2012年全球数据中心能源消耗比2006年增长了一倍,到2016年,数据中心能源消耗将再次翻番。对于传统数据中心而言,数据中心运行所产生的高能耗、高成本、低效率危机已经成为现在面临的主要问题。

1.运营成本

数据中心的技术人员一般不考虑或不用承担数据中心运营带来的成本,但主管信息化的领导已经开始意识到这个问题。服务器随着应用不断增加,机房不断扩大,空调制冷也不断加大。因而带来的直接影响是电量的增加和管理人员的增多,数据中心的运营成本直线上升。国内不少企业的数据中心电力成本为每年几百万元,有的超过了千万元,更有超大规模的数据中心超过了亿元。

由于供电能力的制约和限制,很多地区已无法新建数据中心,甚至原有的数据中心也面临拉闸限电的危险。因此增容、发展等问题也就无从谈起,这对数据中心的高可用性和经济性等多方面造成直接影响。
一些企业的数据中心已经陷入成本危机:一方面,能源成本高昂,并且没有足够的电力和冷却能力,无法满足新一代高密度服务器和存储设备的需要;另一方面,IT基础设施的容量增长受到场地、空间的严重制约。

2.能源消耗

目前,国内大部分数据中心的PUE(数据中心消耗的所有能源与IT负载使用的能源之比)值偏高,在2.5-3左右,而国外高水平的绿色数据中心PUE值往往在2以下。

国内传统数据中心在物理环境方面往往存在:整体布局不合理,制冷系统不能按实际设备的需要进行分配,导致总体能源浪费高且存在局部过热的问题;另外,机房空调设计、布局不合理;电源线缆布放过细,存在重大的安全隐患;由于没有配备保障电源,机房的设备安全运行无法保证。

在IT设备方面,IDC的统计数据显示,在亚太地区,数据中心服务器电力消耗以每年23%的速度递增,与每年16%的世界平均增长水平相比,亚太区数据中心的电力消耗增长速度远超出了世界平均水平。Gartner的调研则显示:“过去五年来, IT设备的能源需求增长已超过五倍。”

3.使用效率

IDC的统计数据显示,大部分数据中心中的服务器和网络设备的利用率仅在24%~30%之间,有的CPU利用率、硬盘利用率都在在10%一下。如何最大限度地发挥现有系统的资源以及优化系统架构,是传统数据中心向绿色数据中心转变过程中首先要考虑的问题。

4.社会责任

数据中心的能耗约占全球二氧化碳排放量的2%,每年IT设备要向大气层排放大约3500万吨的废气,相当于整个航空工业的二氧化碳排放量。数据中心日益增长的能耗及二氧化碳排放量已成为企业无法逃避的社会责任。美国环保署所发布的报告指出:环境保护议题已迫使企业的IT部门必须寻求绿色数据中心的建立。

1.2 软件定义数据中心介绍

软件定义数据中心(Software defined DataCenter,简称SDDC),从最直观的定义来看,就是虚拟化、软件化数据中心的一切资源。

1.2.1 软件定义数据中心的概念

软件定义数据中心就是在各种底层硬件架构上面加载了一个虚拟的基础设施层。软件提供了让数据中心适配新形势和新应用所需的一切,管理了从存储到交换机乃至于安全等方方面面。虚拟化一切,底层硬件的任何变化都与上层应用无关,有了这个基础,可伸缩性和性能问题可迎刃而解。包含有大量遗留资产的数据中心因此可以提高效率、降低成本、实现动态化。所以软件定义数据中心就是把数据中心所有的传统、物理、硬件的资源进行虚拟化、软件化。

VMware对其描述为:“一个统一的数据中心平台,提供了前所未有的自动化、灵活性和效率,并转变IT交付的方式。汇集和汇总计算、存储、网络、安全性等可用性服务,并交付软件,通过智能化的策略驱动的软件进行管理。”

软件定义数据中心将不再需要IT技术人员来操纵孤立的服务器,网络和存储硬件将响应供应请求。相反,配置自动进行定义的规则和框架,政策和服务水平协议(SLA),通过应用程序编程接口(API)调用的自动化和业务流程引擎,并从一个集中的环境内配置适当的资源。

对于整个行业来说,软件定义数据中心已经有了几年的概念铺垫,接下来的几年是其开花结果并形成趋势的重要一年。相信有了之前的基础,软件定义数据中心必然会进行的风生水起。

1.2.2 软件定义数据中心对基础设施的影响

由于动态分配资源的增加,需要升级电源和冷却基础设施,以支持数据中心的可扩展性需求。而提高的电力和冷却能力可以使软件定义数据中心的愿景真正发挥重要作用。IT资源已被虚拟化为一个抽象层,而数据中心本身很少存在这样的抽象层。即使在一个建筑物管理系统(BMS)设施或数据中心基础设施管理(DCIM)系统中,电力和冷却设施往往不能达到软件定义数据中心的要求。

对于数据中心来说,设施设备在确保达到数据中心等级协议(SLA)起到了至关重要的作用。因此,数据中心运营商在符合规划和配置的基础设施能力上。必须开发集成的、适应性强的电源和冷却解决方案。从理论上说,许多的虚拟机可以部署在抽象的虚拟层,但在任何数据中心的电力和冷却的供应量是有限的。因此,数据中心必须优化电源使用,经营者必须重新定义数据中心整合的关键接触点,并构建基础设施管理和监控系统等管理系统。

为了实现软件定义数据中心未来的承诺,需要增加软件定义的电力。如果产业对软件定义的电力能有一个共同的标准参考架构,并达成共识,这将对基于消费需求的数据中心提供适当的电力有所帮助,而不是根据以往的知识和经验用最高峰值来规划和配置的电源和冷却设施。

如今,超过一半的应用程序的宕机都是由电源问题引起的。因此,电力和冷却设施作为软件定义的元素的应用环境,必须提高可用性。而在任何一个数据中心里,其物理资源都有心要加强和改进。

1.2.3 硬件和软件供应商之间的竞争

近年来,数据中心的IT系统经历了一系列的动态变化。在定义系统上,硬件、软件和服务供应商之间一直存在着竞争。例如,华为、爱立信公司在电信行业的竞争是网络功能虚拟化(NFV),而SDN和开放流动是用来挑战思科企业网络优势。同样,SDS是针对EMC和其他大型企业的专有存储阵列。云服务商与数据中心外包商竞争,在构建系统时扮演了同样的角色。

值得注意的是,“标准”并不意味着“开放”。数据中心的软件可以运行在某种硬件上。比如VMware和Microsoft的虚拟化软件是专有的, IBM SVC和NetApp ONTAP存储也可以打开堆栈,开放流动和其他开源项目仍然工作正在进行中。所有的应用程序都应该在虚拟机中运行,这是错误的假设。控制平台和数据平台最好能分开。或者说每个人都希望有在任何时候弹性地做任何事情这样的系统设计。在大多数的数据中心,采取完全变换策略并不容易。例如,某公司采用思科的应用为中心的基础设施(ACI),那么该公司不得不购买大量的Nexus交换机以实现SDN,因为公司业务只能在这个系统上运行。

如果“软件定义”的方法被看作是硬件和软件供应商之间的斗争的一部分,那么可以说,在存储和网络领域中,VMware已经赢得x86服务器虚拟化,亚马逊网络服务赢得了IaaS。大多数数据中心的特点就是拥有大量的管理工具和基础设施的软件,而不是采用一个复杂的新结构,这就是事实。比如在码头和集装箱行业中的涉及运动和距离方面的业务中,需要虚拟化x86机器的所有系统,以及IBM的沃森和little-endian的Linux服务器,惠普的机器等等硬件,这个行业还需要应用程序接口(API)定义和发展目录定义的方法。

1.2.4 软件定义数据中心与云计算

“云”可以看作是应用的网络营销术语,或者是内部或外部客户通过Web形式的采购需求基础设施服务。相比之下,软件定义的数据中心是通过云服务可以提供最有效服务的机制。

软件定义数据中心的长期目标是将其转变成可以提供给最终用户/消费者的服务。目前,实现这一愿景是通过云计算模式如IaaS和平台即服务(PaaS)的最佳方式。采用软件定义数据中心技术,可以提高IT模型实现这一长期愿景的能力,就像云计算一样。

软件定义数据中心在核心硬件资产上超越传统的抽象层,创建一个包括云计算的简单工具包。软件定义数据中心可以让服务器和其他硬件关闭或使其运行在低功率水平上,这可能对设备用电产生有利的影响。一些专家认为,采用软件定义数据中心可以更安全地选择云。软件定义数据中心为企业提供自己的私有云,让他们在托管数据时有更多的控制权。

软件定义数据中心可以通过软件的规则和限制,将那些符合行业标准的复杂硬件动态地分离出来,成为一个资源池。其汇集云计算基础设施的关键特点:

1.标准化
标准化硬件创建资源池的效率。创建基于标准化的硬件环境,在数据中心的动态范围内消除不必要的复杂性。
2.整体化
整个数据中心通过云基础设施的设计,采用最优化的方式支持所有的工作负载。
3.适应性
云基础架构必须是动态的,它具备能够适应变化的资源负载的能力。这种适应性是自动化的,根据应用程序的运行要求,实现基于定义的配置。
4.自动化
自动化是云基础设施的质量标志。当使用软件定义的数据中心空间时,该框架必须具有内置的智能功能,消除复杂性,以及创建弹性计算,而无需工作人员的直接指导。
5.弹性
软件定义数据中心以其自动化和适应性必须能够弥补硬件和软件故障。网络应该自动应对可能出现的问题,并确保最高级别的可用性。

1.2.5 转型中的传统数据中心架构

服务器虚拟化大大提高了数据中心的运营能力,性能上得到了显着的提高,提高了效率和成本效益,使IT部门和计算资源池得到了巩固。许多组织机构正在寻求虚拟化扩展到网络和存储资源。

通过采用抽象层,整个数据中心基础架构实现了智能化和集中管理,组织机构能够有效组织资源设计软件,定义硬件组件,并自动化改造其数据中心。为了充分利用这些能力,企业必须采取战略,旨在建立软件定义的数据中心(软件定义数据中心)。

实现软件定义数据中心的好处是很多的。服务器池化,减少存储和网络硬件和专业组件。现有的硬件更容易维护。最重要的是,软件定义数据中心可以自动化、有策略地实现数据中心资源配置和管理。

程序接口使基于明确规则和策略资源的应用需求资源成为可能。从而构建一个充分利用底层硬件,更加敏捷、灵活、安全,以及高性能的数据中心。

应该指出的是,简单的虚拟化数据中心并不是软件定义的数据中心。软件定义数据中心主要目标之一是支持软件定义的云计算数据中心。例如亚马逊、谷歌和微软等供应商基于云计算基础架构的例子。通过自动化和业务流程实现动态分配和提供资源。软件定义数据中心的设计目的是让企业继承上述公共云供应商的业务流程能力,而不必具有专门的硬件平台。

软件定义数据中心可以提供企业云计算所需要的能力,这可能是真正革命的、安全的。在无数的商业应用中,软件定义数据中心通过云计算和网络,在允许的范围内可以完全免费地实现物理基础设施的部署、管理、存储。随着数据中心技术的不断发展,硬件和软件的关系将变得更加紧密,相互依存。

1.3 作者简单谈谈如何学习虚拟化知识

1.3.1 评估基础知识

既然要学习虚拟化,建议评估一下自己掌握了多少的计算机知识。由于虚拟化所涉及的内容很多,完全没有计算机基础知识的人需要学习的内容相当多。
那么,学习虚拟化需要具备的知识,作者整理了一下:
(1)常用物理服务器的安装调试;
(2)Windows/linux服务器的安装调试;
(3)活动目录相关概念;
(4)网络相关知识;
(5)存储相关知识。
对于以上的知识要求不需要精通,了解其基本概念就行,如果了解这些知识,学习虚拟化应该会起到事倍功半的效果。

1.3.2 熟练掌握系统的安装调试

读者可能会有疑问,在B.1小节中刚说了了解基本概念就行,B.2小节怎么又变成熟练掌握了呢。
这样理解一下,当虚拟化基础架构搭建好后,对外提供服务的是运行在虚拟化基础架构上的虚拟机,虚拟机的操作系统无非就是Windows和Linux,后期的重点就是对Windows和Linux系统的维护操作。如果无法熟练掌握Windows/Linux系统的安装调试,那么对外提供服务的稳定性也就无法保证。
对于Windows系统来说,多数企业的技术人员都能够比较熟练的操作。对于Linux系统来说,不少技术人员不熟悉其命令行操作模式,由于Linux系统的日趋成熟以及版权问题,不少企业在实施虚拟化架构的时候选择了Linux系统,所以熟练掌握Linux系统的安装调试也是必须的。

1.3.3 熟练掌握网络交换机的配置

虚拟化架构对网络的依赖很重,无认是二层网络还是三层网络,网络的连接性是虚拟化架构对外提供服务的关键,ESXi主机以及vCenter Server本身也涉及很多网络交换方面的配置,因此,熟练掌握网络交换机的配置么很重要。

1.3.4 熟练掌握一种数据库的安装调试

即使不使用虚拟化架构,在生产环境中也会用到数据库。作为虚拟化架构实施人员,不需要学习数据库设计、开发等操作,但基本的安装调试、备份恢复是必须掌握的。
在虚拟化架构中,无论是MS SQL、Mysql还是Oracle数据库,比较熟练掌握一种是必须的,除了安装调试操作系统外,数据库的安装调试也必不可少。

1.3.5 多进行实践操作

学习任何计算机知识的重要一点是多进行实践操作,虚拟化也不例外。生产环境不能随意进行操作,但可以使用桌面虚拟软件搭建测试平台进行完整测试,不要担心将测试平台搞崩溃,多从实践中发现问题,解决问题,这样动手能力会得到快速提高。

1.3.6 查阅官方文档

无论是在学习还是使用过程中,都会遇到很多问题,如果自己不能解决,那么可以查阅官方文档,以VMware为例,其官方提供了大量的如何解决问题的文档,对于技术人员来说相当实用。但很多技术人员不喜欢查阅官方文档,其原因是官方文档是英文的。作者的看法是,阅读技术文档,只要能够理解就行,如果还是不行,完全可以借助翻译软件来实现对官方英文文档的阅读。

专栏目录介绍

第1章 了解的VMware vSphere企业级虚拟化平台
1.1 什么是VMware vSphere
1.2 VMware vSphere优势
1.3 生产环境VMware vSphere设计
第2章 掌握ESXi部署
2.1 部署ESXi 6.X系统前提条件
2.2 在物理服务器上部署ESXi 6.X系统
2.3 部署ESXi 6.X系统后一些基础的配置操作
第3章 掌握vCenter Server部署
3.1 部署vCenter Server 6.X系统前提条件
3.2 在ESXi主机上部署vCenter Server 6.X(Windows版本)
3.3 在ESXi主机上部署vCenter Server 6.X(Linux版本)
3.4 生产环境vCenter Server双活配置
第4章 掌握ESXi主机存储配置
4.1 ESXi主机所支持的存储介绍
4.2 配置使用iSCSI存储
4.3 配置使用FC存储
第5章 掌握VMware vSphere环境网络配置
5.1 VMware vSphere网络介绍
5.2 配置使用标准交换机
5.3 配置使用分布式交换机
5.4 生产环境思科NEXUS数据中心系列交换机的使用
第6章 创建使用虚拟机
6.1 VMware vSphere环境虚拟机介绍
6.2 创建Windows虚拟机
6.3 创建Linux虚拟机
6.4 生产环境虚拟机模版的使用
6.5 生产环境虚拟机其他操作
第7章 掌握VMware vSphere高级特性的使用
7.1 高级特性之一:配置使用vMotion冷、热迁移虚拟机
7.2 高级特性之二:配置使用DRS实现生产环境ESXi主机负载均衡
7.3 高级特性之三:配置使用HA故障切换保证生产环境虚拟机故障切换
7.4 高级特性之四:配置使用FT实现生产环境虚拟机双活冗余
第8章 备份恢复虚拟机
8.1 使用Veeam Backup备份虚拟机
8.2 使用Veeam Backup还原虚拟机
从零开始学VMware vSphere专栏总结