在现在存储环境中,集群软件是一个很重要的模块。然而,很多人不清楚集群软件的分类,不知道oracle的RAC,IBM的HACMP,Symantec的VCS和EMC的AutoStart,甚至一些用户写的脚本,分别属于哪一类,它们之间有什么相同和不同的地方:

    一般来讲,集群软件根据侧重的方向和试图解决的问题,分为三大类:高性能集群(High performance cluster,HPC)、负载均衡集群(Load balance cluster, LBC),高可用性集群(High availability cluster,HAC)。有些软件可能夸口说它包含了超出单类型的功能,既可以做负载均衡集群,也可以做高可用性集群。姑且先不说该软件设计的侧重在哪里,但是用户到底需要什么要的集群呢?是负载均衡呢还是高可用性呢?用户肯不肯花两份钱来用其中一半的功能呢?

     下面试三种集群类型的详细介绍:
<!--[if !supportLists]-->1,<!--[endif]-->高性能集群(High performance clusterHPC),它是利用一个集群中的多台机器共同完成同一件任务,使得完成任务的速度和可靠性都远远高于单机运行的效果。弥补了单机性能上的不足。该集群在天气预报、环境监控等数据量大,计算复杂的环境中应用比较多;
<!--[if !supportLists]-->2,<!--[endif]-->负载均衡集群(Load balance cluster LBC),它是利用一个集群中的多台单机,完成许多并行的小的工作。一般情况下,如果一个应用使用的人多了,那么用户请求的相应时间就会增大,机器的性能也会受到影响,如果使用负载均衡集群,那么集群中任意一台机器都能相应用户的请求,这样集群就会在用户发出服务请求之后,选择当时负载最小,能够提供最好的服务的这台机器来接受请求并相应,这样就可用用集群来增加系统的可用性和稳定性。这类集群在网站中使用较多;
<!--[if !supportLists]-->3,<!--[endif]-->高可用性集群(High availability clusterHAC),它是利用集群中系统 的冗余,当系统中某台机器发生损坏的时候,其他后备的机器可以迅速的接替它来启动服务,等待故障机的维修和返回。最大限度的保证集群中服务的可用性。这类系统一般在银行,电信服务这类对系统可靠性有高的要求的领域有着广泛的应用。
    了解了集群的不同后,我们可以很容易的区分不同的集群。首先,一个集群环境中,如果只能由部分机器运行而其他机器作为后备,那么这个集群就属于高可用集群;如果集群环境中所有的机器都在做一件任务,每个单机的单CPU仅仅分担一件任务的一部分工作,那么这种属于高性能集群;如果集群中所有机器同时工作,完成很多不同的任务,那么它就是一个负载均衡集群,集群的功能是为了将不同任务分配到不同单机,分担运行负载。
    现在,我们可以很容易知道现在市场上主流的集群软件的类型,oracle的RAC是多台单机同时访问的,完成不同用户的不同的数据库读写任务,所以它算是负载均衡集群;IBM的HACMP,从名字中就可以看出它是一个高可用性集群(HA)。Symantec的Veritas cluster server和EMC的Autostart也都是高可用性集群。高性能集群一般用在科学运算中,平时商用环境很少应用。