1. 使用w查看系统负载

用法如下:

# w

 18:20:14 up 2 days,  7:57,  1 user,  load average: 0.01, 0.03, 0.05

USER     TTY      FROM             LOGIN@   IDLE   JCPU   PCPU WHAT

root     pts/0    192.168.4.84     10:14    6.00s  0.11s  0.03s w


解释:linux管理员最常用的命令就是这个w了,该命令显示的信息很丰富。第一行从左至右显示的信息依次为:时间、系统运行时间、登录用户数、平均负载。

第二行开始的所有行则是告诉我们:当前登录的用户名及其登录地址等。


注意:在这里面最应该关注的应该是第一行中的load average:后面三个数值。

第一个数值表示一分钟内系统的平均负载值。

第二个数值表示五分钟内系统的平均负载值。

第三个数值表示十五分钟内系统的平均负载值。


备注:我们着重看第一个值,它表示单位时间段内使用cpu的活动进程数(在这里其实就是一分钟内)值越大就说明服务器压力越大。一般情况下,这个值只要不超过服务器的cpu数量就没有关系,如果服务器的cpu数量为8,那么值小于就说明当前服务器没有压力,否则就要关注下。



查看服务器有几个CPU(逻辑CPU)

这里的processor计数从0开始,也就是说第一个显示为0,第二个显示为1。


# cat /proc/cpuinfo

processor   : 1

vendor_id   : GenuineIntel

cpu family  : 6

model       : 58

model name  : Intel(R) Core(TM) i3-3240 CPU @ 3.40GHz

stepping    : 9

microcode   : 0x17

cpu MHz     : 3392.132

cache size  : 3072 KB

physical id : 0

siblings    : 1

core id     : 0

cpu cores   : 1

apicid      : 0

initial apicid  : 0

fpu     : yes

fpu_exception   : yes

cpuid level : 13

wp      : yes



查看当前系统有几个cpu

# grep -c 'processor' /proc/cpuinfo 

1



2. vmstat命令

vmstat命令的含义为显示虚拟内存状态(“Viryual Memor Statics”),它可以报告关于进程、内存、I/O等系统整体运行状态。让我们知道系统的使用瓶颈在哪里。

具体用法如下:

# vmstat

procs -----------memory---------- ---swap-- -----io---- -system-- ------cpu-----

 r  b   swpd   free   buff  cache   si   so    bi    bo   in   cs us sy id wa st

 2  0      0 697556    876 175492    0    0     1     0   53   69  0  0 100  0  0


# vmstat 1        表示每隔一秒输出一次状态且一直输出,按Ctrl+c结束

procs -----------memory---------- ---swap-- -----io---- -system-- ------cpu-----

 r  b   swpd   free   buff  cache   si   so    bi    bo   in   cs us sy id wa st

 2  0      0 697664    876 175524    0    0     1     0   53   69  0  0 100  0  0

 0  0      0 697648    876 175524    0    0     0     0  107  120  0  0 100  0  0

 0  0      0 697648    876 175524    0    0     0     0   79   89  0  1 99  0  0

 0  0      0 697648    876 175524    0    0     0     0   76   97  0  1 99  0  0

 0  0      0 697648    876 175524    0    0     0     0   67   78  0  0 100  0  0

 0  0      0 697648    876 175524    0    0     0     0   72   86  0  0 100  0  0

^C

# vmstat 1 5     表示每隔一秒输出一次状态,共输出五次

procs -----------memory---------- ---swap-- -----io---- -system-- ------cpu-----

 r  b   swpd   free   buff  cache   si   so    bi    bo   in   cs us sy id wa st

 2  0      0 697664    876 175524    0    0     1     0   53   69  0  0 100  0  0

 0  0      0 697648    876 175524    0    0     0     0   80   92  0  0 100  0  0

 0  0      0 697648    876 175524    0    0     0     0   88  106  0  0 100  0  0

 0  0      0 697648    876 175524    0    0     0     0   86   95  0  0 100  0  0

 0  0      0 697648    876 175524    0    0     0     0   70   82  0  0 100  0  0


解释相关进程的作用,重点关注r、b、si、so、bi、bo这几列信息:

procs显示进程的相关信息

r (run):表示运行或等待CPU时间片的进程数。说明:不要误以为等待CPU时间片意味着这个进程没有进行,实际上某一时刻一个CPU只能有一个进程,其他进程只能排着队等着,此时这些排队等待CPU资源的进程依然是运行状态。该数值如果长期大于服务器CPU的个数,则说明CPU资源不够用了。


b (block):表示等待资源的进程数,这个资源指的是I/O、内存等。举个例子:当磁盘读写非常频繁时,写数据就会非常慢,此时CPU运算很快就结束了,但进程需要把计算的结果写入磁盘,这样进程的任务才算完成,那此时这个进程只能慢慢地等待,这样这个进程就是这个b状态。该数值如果长时间大于1,则需要关注一下。


memory显示内存的相关信息

swpd:表示切换到交换分区中的内存数量,单位为KB。

free:表示当前空闲的内存数量,单位为KB。

buff:表示(即将写入磁盘的)缓冲大小,单位为KB。

cache:表示(从磁盘中读取的)缓存大小,单位为KB。


swap显示内存的交换情况

si:表示由交换区写入内存的数据量,单位为KB。

so:表示由内存写入交换区的数据量,单位为KB。


io显示磁盘的使用情况

bi:表示从块设备读取数据的量(读磁盘),单位为KB。

bo:表示从块设备写入数据的量(写磁盘),单位为KB。


system显示采集间隔内发生的中断次数

in:表示在某一时间间隔内观测到的每秒设备的中断次数。

cs:表示每秒产生的上下文切换次数。


cpu显示CPU的使用状态

us:显示用户下花费CPU的时间百分比。

sy:显示系统花费CPU的时间百分比。

id:表示CPU处于空闲状态的时间百分比。

wa:表示I/O等待所占用CPU的时间百分比。

st:表示被偷走的CPU所占百分比(一般都为0,不用关注)



3. top命令

top命令用于动态监控进程所占的系统资源,每隔3秒变一次。它的特点是把占用系统资源(cpu、内存、硬盘I/O等)最高的进程放到最前面。


用法如下:

# top

top - 19:37:58 up 2 days,  9:14,  1 user,  load average: 0.00, 0.01, 0.05

Tasks:  87 total,   1 running,  86 sleeping,   0 stopped,   0 zombie

%Cpu(s):  0.3 us,  0.7 sy,  0.0 ni, 99.0 id,  0.0 wa,  0.0 hi,  0.0 si,  0.0 st

KiB Mem :   999940 total,   696980 free,   126268 used,   176692 buff/cache

KiB Swap:  2097148 total,  2097148 free,        0 used.   692664 avail Mem 


   PID USER      PR  NI    VIRT    RES    SHR S %CPU %MEM     TIME+ COMMAND                                             

    21 root      20   0       0      0      0 S  0.7  0.0   3:13.30 kworker/0:1                                         

  3833 root      20   0  157588   2120   1512 R  0.7  0.2   0:00.77 top                                                 

   496 root      20   0  303272   6760   4780 S  0.3  0.7   5:36.48 vmtoolsd                                            

     1 root      20   0  128104   6700   3948 S  0.0  0.7   0:02.83 systemd                                             

     2 root      20   0       0      0      0 S  0.0  0.0   0:00.01 kthreadd                                            

     3 root      20   0       0      0      0 S  0.0  0.0   0:05.27 ksoftirqd/0                                         

     7 root      rt   0       0      0      0 S  0.0  0.0   0:00.00 migration/0                                         

     8 root      20   0       0      0      0 S  0.0  0.0   0:00.00 rcu_bh                                              

     9 root      20   0       0      0      0 S  0.0  0.0   0:53.45 rcu_sched                                           

    10 root      rt   0       0      0      0 S  0.0  0.0   0:02.18 watchdog/0                                          

    12 root       0 -20       0      0      0 S  0.0  0.0   0:00.00 khelper                                             

    13 root      20   0       0      0      0 S  0.0  0.0   0:00.00 kdevtmpfs                                           

    14 root       0 -20       0      0      0 S  0.0  0.0   0:00.00 netns                                               

    15 root      20   0       0      0      0 S  0.0  0.0   0:00.07 khungtaskd                                          

    16 root       0 -20       0      0      0 S  0.0  0.0   0:00.00 writeback                                           

    17 root       0 -20       0      0      0 S  0.0  0.0   0:00.00 kintegrityd                                         

    18 root       0 -20       0      0      0 S  0.0  0.0   0:00.00 bioset                                              

    19 root       0 -20       0      0      0 S  0.0  0.0   0:00.00 kblockd                                             

    20 root       0 -20       0      0      0 S  0.0  0.0   0:00.00 md                                                  

    26 root      20   0       0      0      0 S  0.0  0.0   0:00.00 kswapd0                                             

    27 root      25   5       0      0      0 S  0.0  0.0   0:00.00 ksmd      


备注:需要关注的值有load average,tasks,%CPU,%MEM。

RES表示进程占用的内存数量。

shift+m表示按内存使用量排序。

shift+p表示按cpu使用量排序。

按数字1可以列出每个cpu的占用量。

top -c显示详细的进程信息。

top -bn1静态显示所有进程。

q退出。

q+PID杀死程。



4. sar命令

sar命令很强大,被戏称为瑞士×××。它可以监控系统几乎所有资源的状态,比如平均负载、网上流量、磁盘状态,内存使用等。与其他系统状态监控工具不同,它可以打印历史信息,可以显示当天从零点开始到当前时刻的系统状态信息。


#yum install -y sysstat     sar命令安装


查看网卡流量历史 sar -n DEV

# sar -n DEV

Linux 3.10.0-514.el7.x86_64 (ccj-01)     2018年1月20日     _x86_64_    (1 CPU)


20时00分01秒     IFACE   rxpck/s   txpck/s    rxkB/s    txkB/s   rxcmp/s   txcmp/s  rxmcst/s

20时10分01秒        lo      0.00      0.00      0.00      0.00      0.00      0.00      0.00

20时10分01秒     ens33     12.01      0.14      0.92      0.02      0.00      0.00      0.00

平均时间:        lo      0.00      0.00      0.00      0.00      0.00      0.00      0.00

平均时间:     ens33     12.01      0.14      0.92      0.02      0.00      0.00      0.00


解释:

IFACE这一列表示设备名称.

rxpck/s这一列表示每秒进入收取的包的数量有多少。

txpck/s这一列表示每秒发送出云的包的数量有多少。

rxkB/s这一列表示每秒收取的数据量(单位为KB)。

txkB/S这一列表示每秒发送的数据量。


注意:

如果有一天服务器丢包非常严重,那么你就该应该查一下网卡流量是否异常了,如果rxpck/s那一列的数值大于4000,或者rxkB/s那一列的数值大于50000000,很有可能是被攻击了,正常的服务器网卡流量不会这么高,除非是你自己在复制数据。



实时查看网卡流量

# sar -n DEV 1 5

Linux 3.10.0-514.el7.x86_64 (ccj-01)     2018年1月20日     _x86_64_    (1 CPU)


20时12分50秒     IFACE   rxpck/s   txpck/s    rxkB/s    txkB/s   rxcmp/s   txcmp/s  rxmcst/s

20时12分51秒        lo      0.00      0.00      0.00      0.00      0.00      0.00      0.00

20时12分51秒     ens33     11.22      0.00      0.82      0.00      0.00      0.00      0.00


20时12分51秒     IFACE   rxpck/s   txpck/s    rxkB/s    txkB/s   rxcmp/s   txcmp/s  rxmcst/s

20时12分52秒        lo      0.00      0.00      0.00      0.00      0.00      0.00      0.00

20时12分52秒     ens33     12.37      1.03      0.82      0.41      0.00      0.00      0.00


20时12分52秒     IFACE   rxpck/s   txpck/s    rxkB/s    txkB/s   rxcmp/s   txcmp/s  rxmcst/s

20时12分53秒        lo      0.00      0.00      0.00      0.00      0.00      0.00      0.00

20时12分53秒     ens33     12.24      1.02      0.91      0.41      0.00      0.00      0.00


20时12分53秒     IFACE   rxpck/s   txpck/s    rxkB/s    txkB/s   rxcmp/s   txcmp/s  rxmcst/s

20时12分54秒        lo      0.00      0.00      0.00      0.00      0.00      0.00      0.00

20时12分54秒     ens33      8.08      1.01      0.56      0.40      0.00      0.00      0.00


20时12分54秒     IFACE   rxpck/s   txpck/s    rxkB/s    txkB/s   rxcmp/s   txcmp/s  rxmcst/s

20时12分55秒        lo      0.00      0.00      0.00      0.00      0.00      0.00      0.00

20时12分55秒     ens33      7.14      1.02      0.45      0.41      0.00      0.00      0.00


平均时间:     IFACE   rxpck/s   txpck/s    rxkB/s    txkB/s   rxcmp/s   txcmp/s  rxmcst/s

平均时间:        lo      0.00      0.00      0.00      0.00      0.00      0.00      0.00

平均时间:     ens33     10.20      0.82      0.71      0.33      0.00      0.00      0.00


使用-f选项查看某一天的网卡流量历史,后面跟文件名。(在Red Hat或者CentOS发行版中,sar的库文件一定在/var/log/sa/目录下

示例如下:

# sar -n DEV -f /var/log/sa/sa20

Linux 3.10.0-514.el7.x86_64 (ccj-01)     2018年1月20日     _x86_64_    (1 CPU)


20时00分01秒     IFACE   rxpck/s   txpck/s    rxkB/s    txkB/s   rxcmp/s   txcmp/s  rxmcst/s

20时10分01秒        lo      0.00      0.00      0.00      0.00      0.00      0.00      0.00

20时10分01秒     ens33     12.01      0.14      0.92      0.02      0.00      0.00      0.00

平均时间:        lo      0.00      0.00      0.00      0.00      0.00      0.00      0.00

平均时间:     ens33     12.01      0.14      0.92      0.02      0.00      0.00      0.00


查看历史负载 sar -q

示例如下:

# sar -q

Linux 3.10.0-514.el7.x86_64 (ccj-01)     2018年1月20日     _x86_64_    (1 CPU)


20时00分01秒   runq-sz  plist-sz   ldavg-1   ldavg-5  ldavg-15   blocked

20时10分01秒         1       105      0.00      0.01      0.05         0

平均时间:         1       105      0.00      0.01      0.05         0


备注:这个命令有助于我们查看服务器在过去某个时间的负载状况。



5. nload命令

sar虽然可以查看网卡流量,但是不够直观,还有一个更好用的工具,那就是nload。


安装nload:

#yum install -y epel-release 先安装扩展源

#yum install -y nload 因为nload依赖于epel-release。


#nload  查看网卡流量:


Device ens33 [192.168.114.1] (1/2):

=========================================================================================================================

Incoming:


                                                                                  Curr: 10.76 kBit/s

                                                                                  Avg: 9.31 kBit/s

                                                                                  Min: 4.62 kBit/s

                                                                                  Max: 13.25 kBit/s

                                                                                  Ttl: 142.85 MByte

Outgoing:


                                                                                  Curr: 8.55 kBit/s

                                                                                  Avg: 8.42 kBit/s

                                                                                  Min: 3.90 kBit/s

                                                                                  Max: 9.18 kBit/s

                                                                                  Ttl: 1.69 MByte


说明:

Incoming为进入网卡的流量。

Outgoing为网卡出去的流量。

主要关注Curr那行的数据,其单位也可以动态自动调整。

按q退出该界面。