Torque搭建文档:

 

操作系统:centos 6.5

 

Torque版本:4.2.7

 

Master

主机名:master

网络:192.168.1.2,255.255.255.0,192.168.1.1,192.168.1.1

功能:调度节点,计算节点

 

Salve

主机名:salve

网络:192.168.1.3,255.255.255.0,192.168.1.1,192.168.1.1

功能:计算节点

 

Master,salve的hosts文件(/etc/hosts)内容:

192.168.1.2  master
192.168.1.3  slave


 

  1. 1.  配置两机器无密码访问

Master:

ssh-keygen -r rsa
ssh-copy-id -i  ~/.ssh/id_rsa.pub master
ssh-copy-id -i  ~/.ssh/id_rsa.pub slave


slave:

ssh-keygen -r rsa
ssh-copy-id -i  ~/.ssh/id_rsa.pub master
ssh-copy-id -i  ~/.ssh/id_rsa.pub slave


2.  编译并安装软件

Master

   

 yum install libxml2-devel openssl-devel gcc gcc-c++ boost-devel libtool-y 
 sh autogen.sh
./configure --prefix=/usr/local/torque427 \
--with-scp--with-default-server=`hostname` && make && make packages&& make install
scp torque-package-{mom,clients}-linux-x86_64.sh slave:
cp contrib/init.d/{pbs_{server,sched,mom},trqauthd} /etc/init.d/
scp contrib/init.d/{pbs_mom,trqauthd} slave:/etc/init.d/
for i in pbs_server pbs_sched pbs_mom trqauthd; do chkconfig --add $i; chkconfig $ion; done


    slave:

./torque-package-clients-linux-x86_64.sh --install   
./torque-package-mom-linux-x86_64.sh --install   
for i in pbs_mom trqauthd; do chkconfig --add $i; chkconfig $i on; done


  1. 3.  配置

Master

    配置环境:

TORQUE=/usr/local/torque427      
echo "TORQUE=$TORQUE" >>/etc/profile
echo "export PATH=\$PATH:$TORQUE/bin:$TORQUE/sbin" >>/etc/profile
source/etc/profile


    调度节点:

        创建/var/spool/torque/server_priv/nodes文件并写入如下内容

       

master
slave


    计算节点:

        创建/var/spool/torque/mom_priv/config 文件并写入如下内容

     

$pbsserver master
$logevent0x1ff


Slave

    配置环境:

TORQUE=/usr/local/torque427      
echo "TORQUE=$TORQUE" >>/etc/profile
echo "export PATH=\$PATH:$TORQUE/bin:$TORQUE/sbin" >>/etc/profile
source/etc/profile


    计算节点:

        创建/var/spool/torque/mom_priv/config 文件并写入如下内容

       

$pbsserver master
$logevent0x1ff


4.  开启服务

Master:

       

for i in pbs_server pbs_sched pbs_mom trqauthd; do service $i start; done


Slave:

       

for i in pbs_mom trqauthd; do service $i start; done


    所有服务开启后主节点使用此命令:

qmgr -c "set server auto_node_np = True"


5.  停止服务

Master:

       

for i in pbs_server pbs_sched pbs_mom trqauthd; do service $i stop; done


Slave:

       

for i in pbs_mom trqauthd; do service $i stop; done

 

6.  测试

pbsnodes –a


                           

State为free 证明成功搭建pbs

7.  防火墙配置

iptables -A INPUT -p tcp -m multiport --dports15001:15005 -j ACCEPT
iptables -A INPUT -p udp -m multiport --dports15001:15005 -j ACCEPT