heartbeat配置文件详解

原创

jerry1111111 2016-09-22 14:47:49 博主文章分类：集群架构 ©著作权

文章标签 配置文件 heartbeat aukeys 文章分类 集群服务器

©著作权归作者所有：来自51CTO博客作者jerry1111111的原创作品，请联系作者获取转载授权，否则将追究法律责任

heartbeat主要的配置文件有3个，aukeys,ha.cf和haresources。下面具体说一下这3个文件的具体功能以及配置。

在说明配置之前先大致阐述一下heartbeat的工作原理：heartbeat最核心的包括两个部分，心跳监测部分和资源接管部分，心跳监测可以通过网络链路和串口进行，而且支持冗余链路，,它们之间相互发送报文来告诉对方自己当前的状态，如果在指定的时间内未受到对方发送的报文，那么就认为对方失效，这时需启动资源接管模块来接管运行在对方主机上的资源或者服务。

在启用Heartbeat之前，安装后要配置三个文件（如没有可手动建立）：ha.cf、haresources、authkeys。这三个配置文件需要在/etc/ha.d目录下面，但是默认是没有这三个文件的，可以到官网上下这三个文件，也可以在源码包里找这三个文件，在源码目录下的DOC子目录里。

====================authkeys====================
heartbeat的认证配置文件

#auth 1
#1 crc
#2 sha1 HI!
#3 md5 Hello!
注释说得很清楚，在这里我还是解释一下，该文件主要是用于集群中两个节点的认证，采用的算法和密钥(如果有的话)在集群中节点上必须相同，目前提供了3种算法：md5,sha1和crc。其中crc不能够提供认证，它只能够用于校验数据包是否损坏，而sha1,md5需要一个密钥来进行认证，从资源消耗的角度来讲，md5消耗的比较多，sha1次之，因此建议一般使用sha1算法。
我们如果要采用sha1算法，只需要将authkeys中的auth 指令(去掉注释符)改为2，而对应的2 sha1行则需要去掉注释符(#)，后面的密钥自己改变(两节点上必须相同)。改完之后，保存，同时需要改变该文件的属性为600，否则heartbeat启动将失败。具体命令为：chmod 600 authkeys

=====================ha.cf======================

heartbeat的主要配置文件（不包含unusual options）：

debugfile /var/log/ha-debug 用于记录heartbeat的调试信息

logfile /var/log/ha-log 用于记录heartbeat的日志信息

如果未定义上述的日志文件，那么日志信息将送往local0(对应的#/var/log/messages)，如果这3个日志文件都未定义，那么heartbeat默认情况下将在/var/log下建立ha-debug和ha-log来记录相应的日志信息。

keepalive 2 发送心跳报文的间隔，默认单位为秒，如果你毫秒为单位，那么需要在后面跟ms单位，如1500ms即代表1.5s

deadtime 30 用于配置认为对方节点菪掉的间隔，指定多长时间后认为节点死亡

warntime 10 发出最后的心跳警告报文的间隔

initdead 120 在某些配置下，重启后网络需要一些时间才能正常工作。这个单独的”deadtime”选项可以处理这种情况。它的取值至少应该为通常deadtime的两倍。

udpport 694 进行bcast和ucast通信的udp端口。这是默认的，并且在IANA官方注册的端口号。

baud 19200 波特率，串口通信的速度。

serial /dev/ttyS0 使用串口heartbeat－如果不使用串口heartbeat，则必须使用其他的介质，如bcast（以太网）heartbeat。用适当的设备文件代替/dev/ttyS0。

bcast eth0 # Linux 心跳所使用的网络接口

mcast eth0 225.0.0.1 694 1 0 如果采用组播通讯，在这里可以设置组播通讯所使用的接口，绑定的组播ip地#址(在224.0.0.0 - 239.255.255.255间)，通讯端口，ttl(time to live)所能经过路由的#跳数，是否允许环回(也就是本地发出的数据包时候还接收)

ucast eth0 192.168.1.2 如果采用单播，那么可以配置其网络接口以及所使用的ip地址

auto_failback on 用于决定，当拥有该资源的属主恢复之后，资源是否变迁：是迁移到属主上，还是在当前节点上继续运行，直到当前节点出现故障。

stonith baytech /etc/ha.d/conf/stonith.baytech 用于共享资源的集群环境中，采用stonith防御技术来保证数据的一致性

watchdog /dev/watchdog 该指令是用于设置看门狗定时器，如果节点一分钟内都没有心跳，那么节点将重新启动

node ken3 设置集群中的节点，注意：节点名必须与uname –n相匹配

ping 10.10.10.254 ping指令以及下面的ping_group指令是用于建立伪集群成员，它们必须与下述#的ipfail指令一起使用，它们的作用是监测物理链路，也就是说如果集群节点与上述伪设备不相通，那么该节点也将无权接管资源或服务，它将释放掉资源。

node primary.mydomain.com 该选项是必须配置的。集群中机器的主机名，与“uname –n”的输出相同。

node backup.mydomain.com 该选项是必须配置的。同上。

respawn 该选项是可选配置的：列出将要执行和监控的命令。例如：要执行ccm守护进程，则要添加如下的内容：

respawn hacluster /usr/lib/heartbeat/ccm 使得Heartbeat以userid（在本例中为hacluster）的身份来执行该进程并监视该进程的执行情况，如果其死亡便重启之。对于ipfail，则应该是：

respawn hacluster /usr/lib/heartbeat/ipfail
注意：如果结束进程的退出代码为100，则不会重启该进程。

apiauth client-name gid=gidlist uid=uidlist
apiauth ipfail gid=haclient uid=hacluster 设置你所指定的启动进程的权限

====================haresource====================

该文件列出集群所提供的服务以及服务的默认所有者。注意：两个集群节点上的该文件必须相同。集群的IP地址是该选项是必须配置的，不能在haresources文件以外配置该地址, haresources文件用于指定双机系统的主节点、集群IP、子网掩码、广播地址以及启动的服务等。其配置语句格式如下：

node-name network-config
其中node-name指定双机系统的主节点，取值必须匹配ha.cf文件中node选项设置的主机名中的一个，node选项设置的另一个主机名成为从节点。network-config用于网络设置，包括指定集群IP、子网掩码、广播地址等。resource-group用于设置heartbeat启动的服务，该服务最终由双机系统通过集群IP对外提供。在本文中我们假设要配置的HA服务为Apache和Samba。

在haresources文件中需要如下内容：

primary.mydomain.com 192.168.85.3 httpd smb

该行指定在启动时，节点linuxha1得到IP地址192.168.85.3，并启动Apache和Samba。在停止时，Heartbeat将首先停止smb，然后停止Apache，最后释放IP地址192.168.85.3。这里假设命令“uname –n”的输出为“primary.mydomain.com”－如果输出为“primary”，便应使用“primary”。

正确配置好haresources文件之后，将ha.cf和haresource拷贝到/etc/ha.d目录。
注意：资源文件中能执行的命令必须在/etc/ha.d/resource.d/ 中可见