一、简介



实验室机房有大概百台的服务器需要管理,加上需要搭建Hadoop以及Spark集群等,因此,一个轻量级的集群管理软件就显得非常有必要了。经过一段时间的了解以及尝试,最终选择了clustershell这个软件,原因如下:



1、安装方便。一条指令就能轻松安装。



2 、配置方便。很多集群管理软件都需要在所有的服务器上都安装软件,而且还要进行很多的连接操作。



clustershell就相当的方便了,仅仅需要所有机器能够ssh无密码登录即可,然后只在一台服务器上安装clustershell即可。



3、使用方便。clustershell的命令相对来说非常简单,只有一两个指令以及三四个参数需要记。



二、安装

1.安装clustershell



安装非常简单,只有一条指令即可,一般服务器都是红帽系列的,使用yum安装。



yum install clustershell

2.配置ssh无密码登录



3.配置/etc/hosts



在hosts中文件中将ip和主机名对应起来,使用比较方便。




Yarn集群管理器主守护进程 集群管理工具_Yarn集群管理器主守护进程



4.配置关键文件


clustershell的配置文件在/etc/clustershell目录下,其中的groups是最常用的,我只配置了这一个文件。


Yarn集群管理器主守护进程 集群管理工具_运维_02




其中all这一项后面添加的是所有的节点。


hadoop这一项是我自己添加的group,也可以添加其他的组。



三、使用


clustershell在使用的时候有一个非常重要的指令就是clush,目前为止我也只用到了这一个指令。


clush [-option] 后面就是日常的linux上执行的指令即可,没什么复杂的,都十分简单。


但是有一点要注意,clustershell执行的类似与一次操作的指令,比如你可以touch一个新文件在所有节点上,但是你不能同时在所有节点上vim编辑一个新文件。细节还需琢磨。


clush有几个比较重要的参数:


-b : 相同输出结果合并


-w : 指定节点


-a : 所有节点


-g : 指定组


--copy : 群发文件


1.查看所有节点的java安装路径,输出结果合并


clush -b -a echo $JAVA_HOME


Yarn集群管理器主守护进程 集群管理工具_大数据_03


2.查看hadoop组所有节点的java安装路径,输出结果不合并


clush -g hadoop  echo $JAVA_HOME


Yarn集群管理器主守护进程 集群管理工具_大数据_04




3.在所有节点上创建一个空文件


clush -g hadoop  touch 1.txt

4.集群分发文件


把本地的一个groups文件分发到hadoop组中所有节点的/home/hadoop目录下


clush -b -g hadoop --copy groups --dest /home/hadoop



四、官方文档


clustershell还有很多功能,但是需求驱动学习,目前我能用到的功能在上面体现了,有需求的话会再学习深一点。上传一个官方文档,有深入学习clustershell,可以下载一下。



有更好玩的功能可以互相交流。