最近在做Linux 环境下的一个运行管理通用脚本,用来管理我的Java 小程序启动、停止等操作。虽说这些可以用手敲命令的方式实现,也不复杂,但程序员么,不就喜欢封装点代码,减少操作啥的。

先讲下脚本的主要逻辑,提供六个方法,包括:usage、is_exist、start、stop、status、restart,它们的作用都体现在方法名上。

脚本接受两个参数,第一个是待执行的程序名,比如我想执行springboot.jar,那参数直接就输入它; 第二个是待执行的操作,脚本提供了四个固定操作,包括start、stop、status、restart。

使用示例如下:

#启动
. 执行脚本.sh 程序完整名称 start
#停止
. 执行脚本.sh 程序完整名称 stop
#重启
. 执行脚本.sh 程序完整名称 restart
#查看运行状态
sh 执行脚本.sh 程序完整名称 status
完整代码如下:
#!/bin/bash
#本脚本基本无需改动,注意要点均已用中文说明
#建议使用 . xx.sh 命令执行脚本。如果使用sh xx.sh执行,注意is_exist方法里的注释
#获取脚本名称
SCRIPT=$0
#获取进程名称,必须为完整程序名,否则可能会误操作其他进程
APP_NAME=$1
#获取操作符
OPERATOR=$2
usage() {
echo "Usage: sh $SCRIPT [app_name] [start|stop|restart|status]"
exit 1
}
#判断是否输入了两个参数
#注意①
if [ $# != 2 ]; then
usage
fi
is_exist(){
#过滤grep命令本身
#注意②
pid=`ps -ef|grep $APP_NAME|grep -v grep|awk '{print $2}' `
#使用sh xx.sh命令执行的话,启用下面代码
#pid=`ps -ef|grep $APP_NAME|grep -v grep|grep -v $SCRIPT|awk '{print $2}' `
if [ -z "${pid}" ]; then
return 1
else
return 0
fi
}
start(){
is_exist
if [ $? -eq "0" ]; then
echo "${APP_NAME} is already running. pid=${pid} ."
else
nohup java -jar $APP_NAME > /dev/null 2>&1 &
}
stop(){
is_exist
if [ $? -eq "0" ]; then
kill -9 $pid
else
echo "${APP_NAME} is not running"
fi
}
status(){
is_exist
if [ $? -eq "0" ]; then
echo "${APP_NAME} is running. Pid is ${pid}"
else
echo "${APP_NAME} is NOT running."
fi
}
restart(){
stop
start
}
case "$OPERATOR" in
"start")
start ;;
"stop")
stop ;;
"status")
status ;;
"restart")
restart ;;
*)
usage ;;
esac

在写脚本的过程中,有两个问题值得记录下来,分别是注意①和注意②。

注意①的问题是我一开始判断条件写成if [ $? -eq "0" ] then,执行脚本的时候提示错误: syntax error near unexpected token fi'。这是由于我漏掉了一个符号;,正确的判断条件为if [ $? -eq "0" ]; then。不过如果then是另起一行则不需要加:,我这为了结构紧凑些,就放在一行了。其他诸如syntax error near unexpected token else的问题也多是这个原因导致的。

注意②的问题是跟shell执行机制有关。一般执行脚本有两种方式:. test.sh和sh .test.sh,先分别说下区别。

. test.sh是在当前shell里执行test.sh里的命令,会根据脚本开头的#!bin/bash找到对应解释器执行,这里就一个进程在执行命令。

sh test.sh是新建一个shell再执行test.sh里命令,这意味着开启两个进程在运行,一个是新建执行shell,一个是执行脚本里的代码。

我最初获取进程pid的命令是pid=`ps -ef|grep $APP_NAME|grep -v grep|awk '{print $2}'`,这句话平日里单独执行时,从未出错,所以这次我在shell脚本里也这样写。

但在执行sh 执行脚本.sh 程序完整名称 status命令的时候出了问题,我随便输入程序名,即使是不存在的,它都会提示程序在运行,并给出pid。

于是我将获取pid的命令改为pid=`ps -ef|grep $APP_NAME`,查看究竟是哪些进程,再次执行脚本后发现了问题,看下图。

[图片上传中。。。(1)] 它将sh test.sh test也查找出来了,而这不是我们需要的,应该将它排除掉,只获取真正执行程序的那个进程,于是获取实际pid的命令改为:

pid=`ps -ef|grep $APP_NAME|grep -v grep|grep -v $SCRIPT|awk '{print $2}'`,最后一个grep -v $SCRIPT即表示排除脚本自身。使用. test.sh方式执行就不需要这样做了,会报错的,因为它不存在这个进程。