Arstechnica.com网站最近对Ars论坛中的服务器论坛“ServerRoom”的用户进行了一项调查,让用户回答他们首次部署虚拟化技术时犯的最大的错误是什么。用户的回答是具有启迪性的。综合集体的智慧,我们把用户的讨论归结为成功地部署虚拟化的6个步骤。
步骤1:确保虚拟化适合你的需求
并非每一个人仅仅是因为虚拟化是一件要做的事情就采用虚拟化。因此,在投入资金和努力走上虚拟化服务器的道路的时候,一定要百分之百地保证你知道为什么虚拟化适合你的企业的全部原因。
用户Zeebee说,你用虚拟化技术整合硬件、可能会降低成本、以便增加企业的弹性和灾难恢复能力。然而,遗憾的是一些人追求这些趋势仅仅是为了保持自己跟上潮流,而没有考虑他们实际上需要什么。
如果你跳上虚拟化的彩车仅仅是为了跳上这个彩车,那么,你很可能没有真正的计划或者没有完全正确的方法。因此,你很可能会犯一些错误。实际上,你的数据中心会比不采用虚拟化技术更糟糕。
步骤2:首先理解虚拟化不是一个“项目” 而是一种新的做事的方法
许多用户强调说,虚拟化部署不是一个具有固定的时间范围、预算、最终交付等过程的“IT项目”。虚拟化标志着你的数据中心运营方式发生根本转变的开始。
代号为“murph182”的网友详细介绍了整个企业范围的思想转变的理由。他的帖子值得全文阅读。他说,就像你必须改变生活方式,而不是简单地减轻体重并且保持减轻的体重一样,你不能简单地实施虚拟化。虚拟化完全是一种新的做事情的方式,是你未来做事情的一种方式。它是需要经过许多阶段才能完成的事情,你的整个努力不会结束。这已经成为了标准。
当把虚拟化当作是一个项目,而不是你的数据中心的现实的时候,那么,你就不会与你的IT运营的每一个方面都集成在一起。你的IT架构中的其它部分(存储、网络和管理等)把你当作提供资源的人,而不是集成他们的流程的东西。管理把虚拟化当作其它的项目,根据他们认为合适的方式提供或者取消资源。IT总的来说将把虚拟化看作是现在就关注的事情,并且不理会它们移动到其它项目。
相反,如果你把虚拟化当作一种生活方式去实施,那么,你的IT机构的各个部分都会更好地接受它。决定在IT的所有的领域实施更好的流程以支持虚拟化将变得更加容易,就更有可能购买监视和管理这个环境的合适的工具。
这种思想转变的具体效果之一是你要开始单个服务器实例的不同,因为每一个服务器的软件组件都必须进行评估,保证它能够在你的整个基础设施中多次地复制。
步骤3:找到合适的人员,保证他们有全面的和具体产品的培训
许多用户强调指出,你的IT部门内部和外部不统一的或者没有经过培训的人员可能对虚拟化部署造成的破坏。因此,要保证直接参与这个项目的人员不仅仅是为了追求热门的数据中心趋势的有热情的人,而且还要保证这些人在你将使用的具体产品方面经过详细的培训。否则,你的承诺就不能实现。
从不利的方面看,一个用户进一步指出,如果你根本就不培训非管理部门的股东,从理论上说,没有虚拟化知识将使关键的决策者非常危险。
名为“murph182”的网友警告说,在我的经验中,在培训人员了解虚拟化的话题的问题上没有折中的方法。管理人员需要真正了解他们正在做什么,否则他们就会做错事情或者提供完全错误的信息。对于不是你的虚拟化平台的指定的管理员的那些人,根本就不用对他们进行培训。事实上,如果你能侥幸做好这些事情,你就不用告诉他们一台服务器是一个虚拟机。
不了解虚拟化工作原理的决策者给我带来了数不清的麻烦。然后,我要完全重新设计一个计划以反应现实的情况。我确实认为这些管理层的决策者认为他们对于虚拟化有足够的了解,不需要我参加这个决策过程。但是,这个结果是引起了更多的麻烦。那些不了解情况的人让我在更早的阶段参加这个决策过程会使这些项目更加顺利。因此,一定要保证参加这个项目的人经过他们需要的培训,否则,就不要让他们参与这个事情。
步骤4:制定政策防止虚拟机蔓延
这个论坛讨论涉及到的最常见的虚拟化缺陷之一是虚拟机蔓延问题。虚拟机蔓延就是虚拟机的数量没有必要地迅速增加,浪费了计算和人力资源。网名为“neilhwatson”的用户说,虚拟机的这种爆炸式增长会增加管理的开销。大多数机构没有使用高级的配置管理服务,从而导致时间不足的和被忽略的主机。
引起虚拟机蔓延的最常见的原因是人们普遍不理解虚拟服务器并不是免费的。每一个虚拟机都占用一定的资源,这个事实必须要告诉用户。
用户们提出了解决虚拟化蔓延的两个主要方法。第一个方法是拥有一个申请虚拟机的正式手续。对于谁可以得到一个虚拟机和谁不应该得到一个虚拟机的批准流程要有一套严格的和一致的规定。换句话说,一个正式的虚拟机申请和批准流程虽然在早期会有一些管理的开销,但是,在虚拟化实施的过程中能够减少许多麻烦。
限制虚拟机蔓延的第二个方法是有一个生命周期的政策以及管理工具和监视能力。这样,你就可以发现和关闭不使用的或者利用率不足的虚拟机。值得指出的是,正如用户“murph182”所做的那样,你需要有某种形式的定期的审计流程,以保证你确实在做这种监视工作和虚拟机使用评估,定期实施虚拟机删除和存档工作。
步骤5:从最开始就使用管理和监视工具
参加这个讨论的许多人都反复强调了虚拟机管理和监视工具的重要性。从部署虚拟化的一开始就采用这些技术是非常重要的,即使那个时候虚拟机的数量非常少。IT部门应该能够随着虚拟机数量的增加轻松地对在网络上创建的所有虚拟服务器实施上述的生命周期管理。但是,在发送虚拟机蔓延的时候,再使用这些工具是很困难的。
用户“Accs”解释了他们在一开始的时候用人工实施虚拟机跟踪和管理,然后在出现虚拟机蔓延之后设法转换到自动工具的情况。他说,我在帮助我的一个用户从人员转换的工具。这个过程用了很长时间。按照当前的IT工作量,在新的工作量堆积起来之前,从人员向工具转换通常没有摆在优先的位置。请一位顾问来做这个工作通常需要在工作完成之后提供一个参考。IT经理可能不会接受这种做法。这是一个马车与马的问题。如果你有管理工具,虚拟机蔓延就能够管理和控制。如果没有,就没有时间设置这些工具,你就麻烦了。
步骤6:不要低估你的存储需求
虚拟化也许能让你使用较少的硬件做更多的计算,但是,虚拟化不能在你管理你的工作量的同时神奇地压缩你存储和移动的数据量。你在后台仍需要实际的硬盘和许多硬盘子系统的带宽把数据移动到需要它的地方。
用户“zero”报告称,我看到的最大的挑战是客户没有认识到虚拟化项目也是一个直接附加存储(DAS)到存储局域网(SAN)的项目。他们没有为他们希望进行虚拟化的工作量确定合适的存储局域网基础设施的容量。他们很难描绘一个充分的存储局域网解决方案的存储性能和容量需求。
这不仅仅是存储局域网的规模问题,这还是带宽问题。网友警告称,不要低估应用程序/服务需要的输入输出处理器的数量和基础的硬盘子系统能够提供的这种处理器的数量。
名为“Zaphod”的网友说,如果我们知道上述错误,我们就会少犯错误。我们就能把2008年的服务器硬件采购减少25%至40%。如果我们当时知道我们现在所知道的情况,我们就能够延长上一代硬件的使用寿命,在08年节省大量的开支,并且在07年减少同样比例的采购。