寻求从SAN 中获益的 IT 经理面临多种选择:市场上的光纤信道交换产品种类繁多,作为一个用户,怎样才能找到建设存储环境的最佳构件呢?最佳构件即是:由它最终建成的基础设施能给予应用系统充分支持,并能随业务需要灵活扩展。企业认识到SAN的益处后,会要求把越来越多的服务器和存储设备纳入SAN。同时,对数据存储和使用需求的惊人增长,也将导致通过 SAN传递的数量大大增加。企业只有谨慎地选择SAN基础设施,才能确保他们的网络日后方便、经济且灵活地扩展,同时保证性能和数据的可用性。
SAN 应用系统评估
为了能设计出最合适的SAN拓扑布局,企业必须准确定义 SAN将要支持的应用环境。这是最重要、可能也是最困难的一步,因为全面的评估不仅要考虑到应用系统目前的性质,而且需要对未来作出预测。
只有基础设施能依照应用系统的动态情况定制,网络才能发挥最大的效益。每个企业的数据环境都有其特性,以不变应万变的方式不适用于存储网络。通过全面评估操作环境,一个企业可以找到其挑选交换产品的最佳标准,并依照当前和未来需要定制 SAN拓扑结构。 如果想从一开始就设计出理想的 SAN 拓扑结构,需要分析所支持的应用系统在数据整合和灾难恢复等多个方面如何影响整个数据环境。必须要评估的主要属性包括:应用要求、数据存储要求、备份和灾难恢复战略、网络连接要求、服务器连接要求。
应用要求
宕机冗余——必须确定应用系统现在和未来的宕机冗余,这样就可以根据应用系统的可用性要求设计相关网络。需要充分估计应用系统的宕机成本和对业务连续性的影响,以便清楚了解是否需要高可用性解决方案。
性能——必须从数据吞吐量和最大可容许延时方面定义应用系统的性能要求。许多应用系统对网络延时十分敏感,促进了低延时网络的设计。
增长——由于应用扩展导致的网络增长必须予以充分的估计。需要从几方面估计增长需要,如用户数量、服务器数量和每应用系统的存储连接数量等。每个因素都要考虑到额外的网络连接和这些连接的必需性能,并对之进行评估。为新用户(如在线存取供应商和用户)提供应用系统接入的计划也应列入考虑。新用户的增长会影响要存储的数据量、网络连接的数量和传输额外数据所需的带宽。
数据存储要求
数据位置——了解数据量和数据的位置很关键。数据是放在统一的存储库中,还是分布在存储小区内?存储据点之间的电缆距离和和服务器连接必需要纳入考虑。长途连接(大于10 公里)会有些特别的连接要求,如支持长途连接的 Switch、光纤信号转发器和桥接等。
数据量——需要存取的数据量是决定网络带宽和存储网络连接数量的关键因素。存储阵列的规模和性能特点将决定支持阵列的必要网络连接数量。此外,每个存储端口支持(扇出比例)的服务器数量由存储制造商确定,以避免网络堵塞和瓶颈。
数据和存取共享——另一项必须完成的评估是:数据在多长时间内、如何被存取和共享?在大多数SAN应用中,数据通常是在服务器和存储器之间共享,而不是在服务器之间或存储器之间共享。增加备份、镜像和其它应用系统,会导致任意网络连接增多。
备份和灾难恢复战略
集中式、离网、少服务器备份是促使企业实施 SAN的主要因素。关于备份如何生成的评估也是必要的,因为它将决定连接范围和吞吐量大小。集中式备份战略要求设计完备的 SAN。为了使战略成功,从备份设备到每一个存储设备之间都应该有一条高速、高可用性的数据路径。
网络连接要求
端口计数要求——评估支持现有和未来增长所需网络连接数是十分重要的。如果在部署初期没有考虑增长因素,事后不断追加网络规模和重新配置会浪费大量资源,并增加宕机时间。在最初设计中如果没有包括完备的扩展战略,在实际应用中不断扩展的网络会出现传输量不平衡的现象,并最终影响整个网络的性能和可用性。
网络传输模式——为统一存储而实施的 SAN与为少服务器备份应用而实施的 SAN 的传输模式很不同。服务器和存储设备之间的新连接需要考虑额外的端口计量。如果忽略了这一点,SAN没有为传输量的增长做好准备,当数据在全网范围内传输时,很有可能产生“瓶颈”。
带宽要求——当初步的网络拓扑设计成熟后,网络中应有特定区域支持高带宽功能。例如,几个只需低带宽的服务器组成的工作组环境可以被集合到一个网络交换连接中。相比之下,存储和高端服务器需要特别配备的(而且可能是多个)网络连接,以确保所需带宽的可用性。
服务器连接要求
每个服务器的 SAN 连接要求需要从带宽、性能和可用性等方面确定,目的是了解每一种连接在正常和高峰传输环境中的不同要求,这样,不论网络活动有多繁忙,网络连接都能够支持运行需要。此外,服务器如何摆放(单独还是成组)将决定每个站点的交换端口数量需要。 在网络的主要属性被确定之后,就要评估和选择建造 SAN 的构件了。只需要较小型SAN的应用系统,通常用一种 Switch 构成即可,这样实施较为简便。要连接的存储器和服务器较少(少于 50)时,一到数个Switch 足以支持环境需要。 如果是支持大型企业应用,就需要多类型 Switch。每种Switch 在基础设施中承担不同的任务。有些Switch 承担到存储库的主要连接,因此需要非常高的可用性。其它 Switch 用于支持服务器集群的整合,只需要高性能和较少端口数量。
另外,我们设计存储网络系统时,还需要考虑如下几个因素:
Switch 类型
广义来说,有三种光纤信道 Switch:Director、网络Switch 和判优环路Switch(或称环路Switch)。企业不能想当然,以为所有厂商的产品都相同。某个厂商的 Director 完全有可能是另一厂商的网络 Switch。
Director——Director是一个多端口、高带宽网络 Switch,用于提供最高的可用性。Director中某个部件的失灵不会影响正常应用,对 SAN 性能和可用性都无影响。Director 有全冗余、热插拔部件(电源、冷却、处理器和交换部件),能将宕机时间最小化。此外,Director 支持在线错误探查、隔离、修理和恢复。 Director 提供99.999%的可用性,或每年少于 5 分钟的宕机时间。Director的高端口数和无堵塞结构使它能提供高性能带宽,允许所有端口同时交流,并能保持性能不变,没有额外延时。
Director 主要用于下列应用系统中:不允许宕机的关键任务系统、企业SAN骨干网,是自身的关键任务资源,提供永远畅通的数据传输路径、应用密集型系统,必须保证任意端口间的高带宽通信、一个Director 结构包括内置冗余,即使部件失灵,也能确保数据流的连续性。
网络Switch:网络 Switch 用于在Switch 所有端口间高速传输数据,不受任何干扰和阻碍。与Director类似,网络 Switch 定义一条通过其它 Switch 的数据传输路径,“编织”Switch 构成的网路,这些网路对连接设备来说是透明的。这种 Switch 是一大类,各个厂商的产品及其属性(冗余、端口数目等)有很大不同。McDATA提供的16 和32 端口网络Switch 包含冗余电源和冷却功能。
单个网络 Switch 提供99.9%的可用性——年平均宕机时间 8.8 小时。网络 Switch 通常担任小型SAN中的骨干“承重墙”,在较大的企业 SAN中,它可作为整合点。网络Switch 主要用于下列应用系统中: 部门级连接、分布式存储占主导地位的应用、小型SAN的标准构件
环路Switch:判优环路(FC-AL)Switch 的连接成本最低,适用于低带宽设备,并支持磁带等传统判优环路设备。环路 Switch 自身不能构成完整网络,它们是用于扩展原有网络的连接设备McDATA的 ES-1000 环路Switch 的独特之处在于它包含一个内置的网络端口。这样,它只需一个专用连接设备与网络Switch 相连,就能很方便地被纳入较大的SAN。大多数环路 Switch 支持环路内端口之间的同步全速数据传输。但是,如果出现多个连接争抢一个端口的情况,环路内就会出现竞争。由于这个问题,大多数环路 Switch 都保持较少的端口数量(8),将带宽竞争控制在最小程度。
环路Switch 主要用于下列应用系统中:  适用于低带宽设备的低成本网络连接、NT服务器整合、磁带整合、交换网络和传统环路的连接、不同类型 Switch 对比、不同类型 Switch 在可用性、性能、可扩展性和成本等方面均有不同。
下面就这些方面做一些对比。对比证明没有一种Switch 可以在所有应用中都有最佳表现。每种 Switch 都有独特的功能特性。因此,它们分别适用不同的应用。
可用性——可用性用于衡量 Switch 正常运行时间,也用于衡量满足应用系统和基础网络需要的能力。由于 SAN提供用户(或应用系统)和信息间的唯一存取路径,因此每条路径的可用性至关重要。 Switch 的可用性是以正常运行时间所占百分比来表示的,数值通常在每年 99%(宕机时间3.6 天)到99.999%(宕机时间少于 5 分钟)之间。
高可用性网络由Director和冗余网络Switch 支持——购买哪种 Switch 可以很容易地通过计算宕机成本和随之导致的业务损失来衡量。
Director—单一Director提供的可用性最高,达 99.999%。如果有全冗余部件,一次故障不会造成任何连接损失。所有部件均可热插拔,因此替换起来非常方便、迅速。不同 Director 端口插板通常采用双路径服务器和存储连接,以便将连接可用性最大化。
网络Switch——单一网络 Switch 的可用性最高可达99.9%(年平均宕机时间8.8 小时),取决于不同厂商的功能设置。有些部件故障是可以在线排除的,例如替换风扇或电源。
其它部件故障可能导致Switch 下线、中断连接或需要替换。替换一台 Switch 至少需要1小时。所有主机和存储设备均通过双路径连接到冗余网络 Switch 后,网络Switch 组成的网络可用性可以高达 99.99%(年宕机时间少于 53 分钟)。不过要求各主机都安装路径恢复软件。由于配置不同,一台 Switch 出现故障,仍然可能造成性能问题,如网络瓶颈增多和延时。为保持 99.99%的可用性,现场需要一台备用 Switch,这样如果主 Switch 出现故障,宕机时间可以缩短到最短。
环路Switch——如果附带冗余电源和冷却装置,单一环路 Switch 的可用性最高可达99.9%(年平均宕机时间8.8 小时)。这些产品主要用于工作组区域连接。如果将所有设备双路径连接到冗余环路Switch,环路 Switch 的可用性可达到99.99%。 确定业务所需最低可用性是正确选择产品的重要基础。在有些环境中,可用性是最重要的目标,因此选用高可用性 Director物有所值。其它环境对可用性的要求没有这么高。对于工作组和部门级办公应用来说,一定时间的宕机是可以容忍的,所以网络 Switch 和环路Switch 已能够满足需要。
性能—无论是只安装一台Switch,还是要建立完整网络,这个问题都不能回避。Switch 的性能特性取决于Switch 的结构。结构性能实际上取决于整体网络设计和网络内的传输模式。
Director 和网络 Switch—单一Director或Switch 的性能取决于其结构。大多数 Director和网络Switch(如McDATA 的产品)都提供高性能、所有端口上任意设备的连接——不论Switch 上别处的传输情况如何,都能保证每个端口的完美性能表现。但是,市场上也有一些产品提供高端口数量,但不提供高性能的任意连接。这类产品实际上是一些小 Switch 的集合,它们相互连接起来,象一个大Switch 的样子。
环路Switch——Switch 上的各个端口分享带宽,而所有端口都通过一个通用连接反向连入整体网络。这种 Switch 提供低成本、低带宽的连接。对于不需要高性能的应用,或者没有 I/O功能,因而不能高速运行的主机,这是一个不错的选择。 当多个Switch 连接起来构成一个大网络后,性能评估变得更加复杂,因为 Switch 间的链接(ISL)很容易成为网络瓶颈,即堵塞。当一个链接上用户过多,就会导致性能下降和延时(从源点往目的地发送信息所需时间)加长。由于许多需要存取数据的应用系统对延时非常敏感,堵塞就成为一个需要解决的重要问题。
必须采取措施确保所有设备在所有潜在数据传输路径上反向通讯时不受带宽限制,甚至在部件发生故障时也不会受到影响。必须审慎确定 ISL数量,确保它们不会成为瓶颈。还需进一步考虑,某一部件发生故障后,正常运行的连接势必承担更多的传输量,在这种情况下,SAN会受到什么影响。 为了充分发挥网络作用,尽量减少 ISL数量非常重要。减少 ISL的最好办法是在 SAN 中采用端口数量多的Director 和Switch,由于所有端口都可进行任意设备无障碍通信,因此可以减少Switch 的数目。在设计阶段,企业必须将预计的 SAN规模(用户端口数)与Switch 规模相匹配。
例如,  一个预计有64个用户端口的SAN可以采用16/24/32或64端口的Switch作为构件。但是如果采用 16 端口Switch 建设SAN,其性能和未来的扩展能力都不理想。可用性最高、性能最好的解决方案是单一 64 端口Director。
扩展性——扩展性指的是SAN能以对业务损害最小的方式增大规模。Director和网络Switch都支持网络连接,并可通过增加 Switch 扩展网络。在原有 SAN设计中就考虑进增长因素,并将需增加的Switch 数量控制在最少是提高可扩展性的关键。这之所以成其问题是因为当 Switch一台台被加进网络时,新 Switch 上的端口以及原有Switch 上的端口必须重新分配到 Switch 的多个链路上。如果加进网络的是端口数量少的Switch,就意味着要不断添加新的Switch,势必降低网络中可用端口的数量。
Director——由于采用的是底盘式设计,因此 Director比较独特。企业可以购买只带有部分端口插板的Director,然后随业务增长逐渐加大容量,同时不影响正常运作。此外,由于Director的端口较多,不需要频繁增加新的Switch。
网络Switch——在网络Switch 中,所有端口都被固定在一块母板上,所以不能分开购买,尽管企业一开始可能用不了那么多端口。与Director一样,端口数越多,为系统扩展而增加Switch的频率就越低。
环路Switch——在单一环路Switch 中,增加端口会降低其它所有端口的性能,因为环路Switch 中所有端口共享带宽。尽管光纤信道环路最多可容纳 126 个环路连接,能保证正常性能的实际连接数要小得多。通常,每个端口只负责一个节点。因此要扩展系统就需增加新的环路Switch。每台新的环路 Switch 都需要额外占用一个Director或网络Switch 端口。
成本——所有网络基础设施的采购,成本都是最重要的考虑因素。不同 Switch 具有不同功能和不同成本。必须在网络层就进行初步成本估算,因为 SAN的整体拥有成本(TCO)是最重要的衡量尺度,相比之下,特定 Switch 的费用是微不足道的。SAN的管理成本也必须考虑到。由端口少的Switch组成的大型网络的管理成本要高于由多端口Director和Switch组成的小型网络的管理成本。 不同型号 Switch的区别就在于每端口的价格。其实,只要运行环境合适,每种 Switch 都能提供低成本连接。例如,比起网络型 Switch 结构,Director 在大型高可用性网络中的运行成本更低廉。相反,在较小的部门环境,16 端口或32 端口的网络 Switch 就已足够。
Director——由于Director 支持99.999%可用性,所以其端口成本较其他Switch 高。另外,Director的端口比网络和环路Switch 多,其总成本也高于其他Switch。
网络Switch——网络Switch 的成本根据产品性能设置和端口数量不同而有很大的区别。拥有冗余电源和冷却性能的网络Switch,每端口价格比没有这些性能的Switch 要高得多。
环路Switch——此类Switch 连接成本最低,是网络 Switch 的一半。如上所述,每端口成本降低,其连接性能更低。 不同性能和规模的SAN,交换总成本差别很大。由于每多出一个 ISL就需要两个端口,所以ISL使用得越多,用于节点连接的端口就越少。网络扩展的同时,可用端口比例也降低,这种情况常常发生在 Switch 端口较少的网络里,因为 ISL占去了较大比例的端口容量。
企业存储网络系统管理
评估不同 SAN交换机都要考虑管理问题。需要对管理能力进行 SAN交换机和网络级两级评估。在多种 SAN设备环境中,仅对 SAN交换机作个别评估,而忽略它们在网络中的互连,以及它们是否支持强大的网络管理模式,这种评估是毫无意义的。随着网络的不断扩展,管理重点从 Switch 转移到网络,管理问题变得重要起来。 SAN交换机管理侧重 Switch 配置和流量监控。该功能有助于用户评估端口的应用情况和Switch 的总容量。
网络管理则侧重于全网运行,而非某个 Switch。为此,网络管理需要从每个Switch 中获取详尽信息,以评估整个网络运行状况。 网络故障隔离和恢复也是网络管理的重点。网络管理员在发现和确定网络问题基本成因上花费的时间,往往比恢复和修补的时间更多。使用 McDATA 公司网络连接管理(EFCM)软件,各种类型的McDATA Switch 可以集中管理,单点控制,大大简化了监控和故障排除。 因为利用单个网络管理应用程序管理不同供应商Switch 是相当复杂的,所以必须考虑到供应商产品的特点,结果是:多供应商网络中,用户要管理异构 SAN,要使用多种管理工具,导致管理变得更加复杂,成本也更高。