大型分布式系统,通常是由一组服务器集群构成的。对于这样的系统架构,设计往往比较复杂,需要考虑的因素也相对较多。从总体的设计原则来说,在系统架构和设计的时候,需要重点考虑以下四个方面的因素:

1、高稳定。顾名思义,指的是每一个应用服务要足够强壮,在一定的负载下可以持续7*24运行一年或者更长的时间而不宕机。

2、高可用。指系统在应对各种突发故障(例如某机房掉电)时,能在足够短的时间内自动切换到备份系统,使所有的系统应用恢复正常。通俗来说,就是容灾的设计。针对高可用而言,还有一个重要的应用就是系统维护。系统维护的实现依赖于系统高可用性。系统运行的时间越长,系统宕机的风险也越大。因此,在主系统运行了相当长的时间以后,是有必要进行系统维护的。再好的马,也有累的时候,也需要休息。同时,由于系统维护的应用,可以更好的保障系统的高可用性。例如,当我们发现某些系统发生预警的时候,及时将系统切换到备份系统,当故障排除或者警报解除以后,可将系统切回主系统。

3、高性能。主要体现在两个方面:高响应和高容量。通俗来说就是又快又多。从外部看,我们不仅可以给数千万(或者更多)的用户提供服务,同时,对每一个用户服务的响应速度也要很快。从内部来看,在单位响应时间内,单一系统能承载的容量要足够大。

4、高扩展。需考虑两个方面的含义:(1)系统易于扩展;(2)系统的扩展性能。易于扩展就是说,系统依赖简单,配置简单,便于系统维护人员进行扩展。对于系统扩展性能的考虑主要是做好系统的负载均衡设计,能实现当新的可扩展系统加入集群以后,能最大可能的分担整体系统的压力,提高系统性能。

因此,从测试的角度来看系统集群架构,以上四个方面就是测试需要考虑的重点因素。