服务器虚拟化建议方案
前 言
1公司IT现状
1.1服务器资源利用率不高
1.1.1 CPU资源利用率
1.1.2内存资源利用率
1.1.3存储资源利用率
1.2机房环境混乱
1.2.1服务器老化严重
1.2.2机房线缆杂乱
1.2.3设备线缆无规范标识
1.3 IT管理效率低下
1.4 IT敏捷性下降
1.5 落后的IT基础架构
2VMware虚拟化平台优势
2.1降低TCO
2.2先进的IT管理
2.3提升运营效率
2.4保证业务的连续性
2.5平台高可扩展性
2.6保证数据的安全性
3虚拟化平台基本架构
3.1基础架构服务器
3.1.1虚拟计算
3.1.2虚拟存储
3.1.3虚拟网络
3.2应用程序服务
3.2.1可用性
3.2.2安全性
3.2.3可扩展性
4VMware虚拟化平台建议方案
4.1方案拓朴图
4.2集群架构设计
4.3虚拟化层设计
4.4集中管理设计
4.5数据备份方案
4.6服务器硬件配置建议
4.6.1 CPU配置
4.6.2内存配置
4.6.3网卡配置
4.6.4HBA卡配置
4.6.5共享存储
4.6.6 LUN划分
4.6.7光交换机
5 vSphere5主要功能说明
6VMware虚拟化产品简价
6.1 Vmware虚拟化软件清单
6.2建议采购硬件清单
前 言
VMware的服务器虚拟化解决方案能够帮助用户以服务器虚拟化的方式,对现有IT资源进行服务器虚拟化整合,以提供降低 IT 复杂性的新方法,它将按需提供的自助管理虚拟基础架构汇集成高效池,以服务的形式提供计算。
针对公司现有的IT资产,服务器资源利用率进行调研,分析,发现服务器硬件资源的总体利用率并不高。大多数服务器并不对外提供关键业务,一段时间内业务量并不会有明显增加,但随着我公司的业务拓展逐步加快,新增项目逐渐增多,需要采购更多的服务器来满足日益增加的项目需求,从ROI/TCO来看并不划算。
1公司IT现状
公司网络拓朴图
图1-1
服务器资源统计表
图1-2
公司IT机房目前共有35台服务器,除去因故障、无硬盘、没有使用,目前正在使用的服务器为25台。本信息表仅统计正在使用的服务器资源进行统计。
1.1服务器资源利用率不高
1.1.1 CPU资源利用率
图1-3
从图1-2可以很清楚的看出服务器CPU资源利用率普遍低于10%,仅有4台服务器的CPU资源利用率高于10%。从图1-3可以看出有7款不同型号的CPU,其中Intel(R)Xeon(TM)2.80GHz的CPU的服务器占到了56%,而这款CPU早已成为过去时。
1.1.2内存资源利用率
图1-4
从图1-4可以很清楚的看出超过一半的服务器内存资源利用率低于50%。
1.1.3存储资源利用率
图1-5
结合图1-2与图1-5可以看出,大部分的服务器标配的磁盘空间都非常小,一小部分服务器的磁盘空间利用率仍就非常低,而一部分服务器磁盘空间又明显不够,但确没有及时扩充磁盘空间。
1.2机房环境混乱
1.2.1服务器老化严重
图1-6
从图1-6可看出各厂商服务器的的分布情况,除了少数几台DELL与HP服务器仍在维保期内,其余的服务器早已经过了三年的维保期限,也没有再续购维保,服务器的后期服务得不到保障,而且MSI的服务器设备已经相当之陈旧,随时都有报废的可能。这部分服务器占到了总服务器的58%,这是一个非常危险的信号。
1.2.2机房线缆杂乱
机房各种线缆随处可见,线缆乱接乱放,而且没有任何标记,都是临时需要临时做,线缆质量与工艺都得不到保证,也没有库存的标准线缆。
1.2.3设备线缆无规范标识
机房的的大部分设备和线缆都没有统一格式的标签,有些就是用一个手写标签纸直接贴上去,及其不规范,有的设备或线缆甚至就直接没有标签。这些都是机房建设和管理极不规范的地方,后期会给我们的机房管理带来很多不便。
1.3 IT管理效率低下
机房的服务器目前仍采用陈旧的管理模式,人工定期巡检,没有较好的管理与资源监控手段,不能实时的了解到服务器的运行状态,资源的利用情况。服务器出现故障时较难定位故障,而且都是事后处理,不能做到事前预防。再加之公司从成本考虑,IT维护成本预算不多,IT维护人员不足,整个公司内部的IT管理仍是很落后且效率低下。
1.4 IT敏捷性下降
每当有新的项目需要申购一台服务器,也许服务器配置要求并不算高,但是由于没有库存的服务器,我们不得不走相当漫长的申购流程。一方面IT的时效性得不到保证,另一方面我们花了大量的人力与物力在这些事情上,导致IT管理人员没有太多的时间去思考更具有战略性的方案。
1.5 落后的IT基础架构
公司IT基础架构仍旧非常滞后,依旧是各个系统独立管理,各自为政。管理员需要考虑每一个计算资源、每一个应用系统的配置情况,需要考虑每一个应用系统它所需要的各种计算资源,包括服务器、存储、网络、应用系统等等,这种管理模式的管理成本高,也让管理员的工作变得非常复杂,需要人为考虑和干预的过程非常多,容易造成管理上的失误,同时,管理员很难对数据中心内的计算资源和应用系统去进行全盘考虑,不利于数据中心的整体优化。
2 VMware虚拟化平台优势
2.1降低TCO
通过服务器整合,控制和减少物理服务器的数量,提高物理服务器系统资源的利用率,降低硬件成本;
降低运营和维护成本,包括机房空间、机柜、网线、光纤线,耗电量,冷气空调和人力成本等;提高IT 投资回报率。
2.2先进的IT管理
通过vCenter可实现对整个虚拟化平台集中资源管理,管理员可以管理平台内所有的计算资源,包括服务器、网络、存储、软件等。管理员可以利用此模块进行计算资源的增加、删除、修改和配置。集中资源管理模块提供访问接口,后台组成主要包括资源数据库,中间件模块和资源管理接口。通过集中资源管理,服务器虚拟化管理员可以实现:
l物理设备的配置和管理
l进行系统平台管理和配置
l应用软件的配置和管理
l网络资源的配置和管理
2.3提升运营效率
Vmware虚拟化能帮助我们更好的管理整个平台的资源,实时监控资源使用情况,一旦要上新的项目,再不必走冗长的服务器申购流程,IT管理员能够利用虚拟化的优势快速分配虚拟服务器,以前需要1个月能完成的事情,现在缩短到30分钟甚至更短的时间。极大的提高了IT运营效率,同时又给公司节约了人力与物力成本。
2.4保证业务的连续性
Vmware虚拟化平台通过HA集群技术,保证业务连续性。即使硬件,操作系统,应用程序任何一层出现故障,都不会影响业务的正常运行。
2.5平台高可扩展性
Vmware虚拟化平台采用弹性架构设计,具有良好的平台可扩展性。CPU,内存,存储,网络等任何一处出现硬件资源不足的情况,都能在不影响现网业务正常运行的前提下方便的扩展硬件资源。
2.6保证数据的安全性
Vmware可通过自带的DataRecovery组件方便快速的实现虚拟机数据的安全备份,保证数据的安全性。
3虚拟化平台基本架构
图1-7
Vmware虚拟化平台做为统一的服务平台,包括二个层次:基础架构服务层和应用程序服务层。
3.1基础架构服务器
基础架构服务层是整个虚拟架构的重要支撑,主要是将物理的资源,包括计算资源、存储资源和网络资源进行虚拟化。
3.1.1虚拟计算
计算资源的分配粒度,包括内存和CPU的分配方式。能够进行分配的粒度越细,往往效率越高,所以,内存可以分配细化到MB,CPU分配可以细化到MHz。
Hypervisor是服务器虚拟化的基石,目前,瘦Hypervisor已经成为虚拟化行业的重要趋势,通过Hypervisor的瘦化,可以降低虚拟化本身的超载,降低虚拟化本身的资源消耗,从而提升整个虚拟化系统的性能。
3.1.2虚拟存储
虚拟化平台中集群文件系统是构建虚拟化高可用的重要基础技术,通过虚拟化集群文件系统,可以确保进行虚拟环境交叉访问时,保证数据的完整性和可靠性。
卷的动态成长可以实现磁盘卷的在线扩展,为服务器虚拟化提供强大的存储虚拟支持能力,满足存储卷的按需扩展。
Storage VMotion可以实现存储迁移时应用不需要停机,这是存储虚拟化和服务器虚拟化结合的范例,成为服务器虚拟化的标准配置功能。如下图:
图1-8
vStorage精简配置(ThinProvisioning)的具体实现见下图,最大的好处是提高存储的利用率,降低存储的成本超过50%。
图1-9
3.1.3虚拟网络
虚拟网卡是为了满足同一服务器上多个虚拟机而建立的,是服务器虚拟化的重要基石。vSwitch虚拟交换机可以在虚拟机和物理机之间提供第 2 层连接性,其功能包括:
l虚拟局域网分段(有助于简化网络)、流量隔离以及改进的可管理性
l内置的网卡绑定(有助于提高可用性)以及物理网络资源的负载平衡
l流速限制,有助于增强对物理网络流量的控制
图2-1
vDS分布式交换机主要是进一步简化虚拟化环境中的网络管理而实现的,可在数据中心级别提供集中和聚合的虚拟网络,从而简化并增强虚拟机网络。
图2-2
3.2应用程序服务
应用程序服务是vSphere内置的应用程序服务级别控制,提供了对上层应用的高可用性、安全性和可扩展性等的全面支持,以保证应用运行在一个安全、可靠、伸缩性强的平台之上。可以通过统一的方式对运行于 VMware 虚拟机中的任何应用程序轻松启用应用程序服务,从而为 IT 部门提供简单的应用程序服务级别内置控制。
3.2.1可用性
l计划内停机
通过使用 VMwareVMotion,在进行计划内服务器维护以至跨服务器的虚拟机实时迁移时,将不再需要为这些活动安排应用程序停机,从而不会对用户造成中断或导致服务丢失。
图2-3
VMware Storage VMotion 支持实时迁移虚拟机磁盘,因此不再需要为计划内存储维护或在存储迁移期间安排应用程序停机,从而不会对用户造成中断或导致服务丢失。
l计划外停机
VMware HighAvailability (HA) 可提供高性价比的自动化重启,当发生硬件或操作系统故障时,几分钟内即可实现所有应用程序的重启。
图2-4
VMware Fault Tolerance (FT)可提供持续可用性,使所有应用程序都不会发生任何数据丢失或停机。
图2-5
3.2.2安全性
VMware vShield在共享环境中的应用程序级别执行企业安全策略,同时仍然保持对用户及敏感数据的信任和网络分段,从而简化应用程序安全管理。
图2-6
3.2.3可扩展性
VMware DRS 可对服务器资源进行动态的负载平衡,以根据业务优先级向正确的应用程序提供正确的资源,从而让应用程序可以根据需要而缩减或增长。
图2-7
4 VMware虚拟化平台建议方案
4.1方案拓朴图
图2-8
方案拓扑说明:
整个方案采用分层虚拟架构体系,依次分为SAN存储系统层,物理服务器层,虚拟化管理层,应用系统层,1000M网络层,客户端与监控管理层。
4.2集群架构设计
Vmware虚拟化采用集群架构设计,保证虚拟应用的高可用性。在3台Dell PowerEdge R710的服务器上分别安装ESXi5.0的虚拟化管理软件,并在vCenter管理中心开启HA集群功能,实现对集群内虚拟机应用的保护,当集群内某台主机故障发生时,主机上的HA代理检测到故障发生后,在其它主机上重启该故障主机上的虚拟机应用。本设计方案将物理服务器层与SAN存储系统分离,使整个架构具有更强的可扩展性,当服务器资源不足时,可以方便的添加服务器,不影响现网业务的正常运行,当存储资源不够时,可以方便的添加存储,摆脱传统基础架构模式下,增加硬件资源需要停机中断业务的限制,见图2-4。
4.3虚拟化层设计
方案的主机部分是在3台DELL R710服务器上安装ESXi5.0这一裸机虚拟化管理程序,由于其超精简的体系结构和磁盘空间占用不到 100 MB 的代码库大小,ESXi 不但可提供 ESX 的业界领先的性能和可扩展性,而且还具备其他一些优势:
更完善的可靠性和安全性 -由于代码行更少并独立于通用操作系统,ESXi 大幅减少了错误或安全漏洞的风险,使得保护您的虚拟化管理程序层的安全变得更容易。
简化的部署和配置 -ESXi 拥有的配置项比 ESX 少得多,因此可以极大地简化部署和配置,并且更容易保持一致性。
更高的管理效率 -ESXi 采用基于 API 的合作伙伴集成模型,因此不需要安装和管理第三方管理代理。利用远程命令行脚本编写环境(例如 vCLI 或 PowerCLI),可以自动执行日常任务。
简化的虚拟化管理程序修补和更新 -由于 ESXi 的体积更小,组件更少,因此所需的补丁程序比 ESX 少得多,从而缩短了维护时段,并减少了安全漏洞。
图2-9
4.4集中管理设计
建议在一台DELLPowerEdgeR510服务器上安装VMwarevCenter5做为虚拟化管理中心(这是管理基础架构和应用程序服务所必需的),提供了一个中心控制点,能够深入监测虚拟基础架构的每个方面,实现日常操作任务的自动化,并具有管理大型数据中心环境的可扩展性。
图3-1
同时建议安装vCenterOperations实现对整个平台的统一监控,vCenterOperations负责收集和分析性能数据,将异常现象关联在一起,并且能够指出造成性能问题的根本原因。它还提供容量管理来优化资源利用率,并且提供基于策略的配置管理来确保遵从性并消除数量剧增和配置偏差问题。
图3-2
业务运营管理平台整合了服务器虚拟化产品本身管理控制台的分配调度、策略配置、统计分析等管理功能,方便管理人员使用;平台提供面向不同业务应用的监控视图,可方便查看各类应用系统的使用情况、应用系统内部各资源的调用关系、各资源使用情况等,并可根据业务需要,提供基于业务规则的实时告警。
图3-3
4.5数据备份方案
VMware Data Recovery 可创建虚拟机备份,同时不会中断虚拟机的使用或其提供的数据和服务。DataRecovery会管理现有备份,并在这些备份过时后将它们删除。它还支持重复数据删除功能以删除冗余数据。
部署Vmware DataRecovery 进行虚拟机备份,没有任何风险,因为DataRecovery是Vsphere平台下免费的无代理无网络连接的备份方案。需要备份的虚拟机不需要安装任何软件,也不需要做任何系统参数的修改,备份直接调用虚拟api.只是在ESXi平台下部署各虚拟机,对整个虚拟环境没有任何影响。
Data RecoveryBackup示意图:
图3-4
Data RecoveryRestore
图3-5
4.6服务器硬件配置建议
4.6.1 CPU配置
CPU应尽量使用多CPU多核,高主频配置。如果集群内有不同型号的服务器,应考虑CPU的指令集是否相同,否则有可能导致Vmtion失败。
4.6.2内存配置
根据以下原则来配置内存,对于内存不够的服务器需要增加内存以满足需要。
服务器内存最小值=服务器总核数X 4G
4.6.3网卡配置
网卡建议使用千兆网卡。
在使用SAN存储时,网卡最少3块(或3个端口),2块网卡做teaming绑定,为服务器的生产IP网;1块网卡为vSphere内部通信使用,与生产IP网分离。建议为6个网络端口。
4.6.4HBA卡配置
使用光纤存储时,需要配置HBA卡,为避免单点故障,建议配置2块HBA卡。
4.6.5共享存储
必须有共享存储,如SAN、IP-SAN、NAS、NFS等等,每一台服务器都能够使用共享存储(都要配HBA卡)。为了避免出现存储I/O瓶颈,强烈建议使用SAN存储。
4.6.6 LUN划分
LUN大小建议小于1T,每个LUN都要分配给集群内所有的服务器,每个LUN的虚拟机数量在10-15个。
4.6.7光交换机
考虑单点故障,建议采购2台光交换机。
5 vSphere5主要功能说明
6 VMware虚拟化产品简价
6.1 Vmware虚拟化软件清单
产品名称 | 版本 | 许可 | 功能说明 |
VMware vCenter Sever | 5.0标准版 | 按实例 | 实现虚拟机集中管理,通过2实例建立高可用 |
VMware vSphere | 5.0企业增强版 | 按物理CPU数量 | 实现服务器虚拟化基础架构的虚拟化软件 |
Vmware vCenter OperationManager | 1.0 | 按VM数量 | 云平台负载、容量、状态监控 |
Windows 操作系统 | R2标准版 | 根据实际需要购买授权 | |
RHEL | AP 5企业版 | 根据实际需要购买授权 | |
SUSE | 11.0企业版 | 根据实际需要购买授权 |
6.2建议采购硬件清单
产品名称 | 型号 | 数量 | 功能说明 |
三层交换机 | 华为S5700-24TP-SI-AC | 1台 | 服务器上联交换机 |
HBA卡 | 4GB单卡双口 | 2块 | DellR710存储连接 |
内存 | 8G DIMM 1333 | 8根*2 | Dell R710支持 |
光纤跳线 | LC-LC 10M | 8根 | |
网线 | 超五类 | 一箱 |