CentOS操作系统巡检指南

CentOS操作系统作为一种流行的Linux发行版,在很多企业和个人用户中都有着广泛的使用。为了确保系统正常运行,需要经常进行巡检。本文将介绍一些常见的CentOS操作系统巡检任务,并提供相应的shell脚本。

  1. 检查系统日志

系统日志记录了系统运行过程中发生的事件,包括错误信息、警告信息等。检查系统日志可以帮助我们了解系统运行状况,及时发现和解决问题。以下是一个检查系统日志的shell脚本:

#!/bin/bash
LOGDIR="/var/log/"
logs=(boot.log messages secure)

for log in "${logs[@]}"
do
    echo "Checking $log"
    grep -iE 'fail|error|warning' ${LOGDIR}$log
    echo
done

这个脚本检查/var/log/目录下的三个日志文件(boot.log、messages、secure),并输出其中包含fail、error或warning的行。

  1. 检查系统负载

系统负载指的是CPU和IO等资源使用情况,通常用load average表示。检查系统负载可以了解系统的运行状况,判断是否需要扩容或优化。以下是一个检查系统负载的shell脚本:

#!/bin/bash
load=$(uptime | awk '{print $10,$11,$12}')

echo "Current load average: $load"

这个脚本使用uptime命令获取当前系统负载,输出格式为load average: 0.01, 0.03, 0.05。其中三个数字分别表示1分钟、5分钟、15分钟的平均系统负载。

  1. 检查磁盘空间

磁盘空间是系统运行的基础资源,如果磁盘空间不足,可能会导致系统崩溃。检查磁盘空间可以帮助我们及时释放空间,避免出现问题。以下是一个检查磁盘空间的shell脚本:

#!/bin/bash
filesystem="/dev/sda1"
threshold="80%"

if ! df -P $filesystem | awk '{print $5}' | tail -1 | grep -e "\%" > /dev/null 
then 
    echo "Filesystem $filesystem not found!"
    exit 1
fi

usage=$(df -Ph $filesystem | awk '{print $5}' | tail -1)
if [ $usage \> $threshold ]
then
    echo "Warning: Disk usage $usage is over threshold $threshold"
else
    echo "Disk usage is $usage"
fi

这个脚本检查/dev/sda1分区的空间使用情况,如果使用率超过80%会输出警告信息。

  1. 检查网络连接

网络连接是系统与外界通信的关键,如果出现问题会导致网络不稳定和服务中断。检查网络连接可以帮助我们及时发现和解决网络问题。以下是一个检查网络连接的shell脚本:

#!/bin/bash
ping -c 3 www.baidu.com > /dev/null
if [ $? -eq 0 ]
then
    echo "Network is OK"
else
    echo "Error: Network is down"
fi

这个脚本使用ping命令检查是否能够连接www.baidu.com,如果返回值为0表示网络连接正常,否则表示网络连接出现了问题。

  1. 检查服务运行状态

服务是应用程序的运行环境,如果服务停止运行,可能会导致应用程序无法访问。检查服务运行状态可以帮助我们及时发现和解决问题。以下是一个检查服务运行状态的shell脚本:

#!/bin/bash
services=(httpd mysqld sshd)

for service in "${services[@]}"
do
    if systemctl is-active $service.service > /dev/null 
    then
        echo "$service is running"
    else
        echo "Error: $service is stopped"
fi

这个脚本检查httpd、mysqld和sshd三个服务的运行状态,如果服务正在运行,则输出服务名和状态为running;如果服务未运行,则输出服务名和状态为stopped。

总结

CentOS操作系统巡检是确保系统稳定运行的关键,通过检查日志、负载、磁盘空间、网络连接和服务运行状态等关键指标可以及时发现和解决问题。以上是一些常用的CentOS操作系统巡检任务和对应的shell脚本,您可以根据自己的需求进行调整和优化。