Linux系统命令之vmstat

精选转载

onlinekof2001 2015-04-17 13:32:13 博主文章分类：Linux系统维护

文章标签 vmstat 文章分类 运维

vmstat全称vitural memory statistics，是作为系统管理常常会用到的一个监测工具。

vmstat生成的报告包括processes，momery，paging，block IO,traps，和cpu activity。

[oracle@SH-SRV-APPDB:]$vmstat 2 10   
procs  -----------memory----------   ---swap-- -----io---- --system-- -----cpu------
 r  b   swpd   free   buff  cache     si   so    bi    bo   in   cs us sy id wa st
 9  0 332184 686436 311844 58468628    0    0    16   490 4776 4385 24  2 73  0  0
 3  0 332184 687236 311844 58468668    0    0    28   568 5842 5583 27  2 71  0  0
 6  0 332184 697472 311848 58468708    0    0    20   642 2810 2146 21  1 78  0  0
 4  0 332184 694996 311884 58468804    0    0    16   408 2293 1660 19  1 80  0  0
 6  0 332184 695300 311884 58468964    0    0    52   664 2500 2119 23  2 75  0  0
 9  0 332184 695584 311892 58469036    0    0    20   678 4187 4235 26  2 72  0  0
 6  0 332184 696036 311892 58469204    0    0     8   194 3195 2754 32  2 65  0  0
 9  0 332184 696072 311892 58469276    0    0    24   494 2003 1517 31  3 66  0  0
 8  0 332184 758744 311896 58469316    0    0    12   858 2298 1653 35  1 63  0  0

-a 转换的展示活动和非活动的内存

-f 转换的展示从启动后forks的数量，包含fork，vfork和可能系统的调用。

-m 显示slab信息。

-n 标题的仅显示一次。

-s 显示各类事件表总计

-d 显示磁盘统计

-p 显示部分分区细节信息

-S 该参数随后指定（k，K，M）等单位，规范输出的单位

-V 显示vmstat的版本信息

r 表示运行队列(就是说多少个进程真的分配到CPU)，当该值超过了CPU数目，就会出现CPU瓶颈了。这个也和top的负载有关系，一般负载超过了3就比较高，超过了5就高，超过了10就不正常了，服务器的状态很危险。top的负载类似每秒的运行队列。如果运行队列过大，表示你的CPU很繁忙，一般会造成CPU使用率很高。

b 表示阻塞的进程的数量

swpd 虚拟内存已使用的大小，如果大于0，表示你的机器物理内存不足了，如果不是程序内存泄露的原因，那么你该升级内存了或者把耗内存的任务迁移到其他机器。

free 空闲的物理内存的大小。

buff Linux/Unix系统是用来缓存脏数据等，使数据异步的写入磁盘，减少频繁的I/O操作。

cache cache直接用来记忆我们打开的文件,给文件做缓冲(这里是Linux/Unix的聪明之处，把空闲的物理内存的一部分拿来做文件和目录的缓存，是为了提高程序执行的性能，当程序使用内存时，buffer/cached会很快地被使用。)

si 每秒从磁盘读入虚拟内存的大小，如果这个值大于0，表示物理内存不够用或者内存泄露了，要查找耗内存进程解决掉。我的机器内存充裕，一切正常。

so 每秒虚拟内存写入磁盘的大小，如果这个值大于0，同上。

bi 块设备每秒接收的块数量，这里的块设备是指系统上所有的磁盘和其他块设备，默认块大小是1024byte。

bo 块设备每秒发送的块数量，例如我们读取文件，bo就要大于0。bi和bo一般都要接近0，不然就是IO过于频繁，需要调整。

in 每秒CPU的中断次数，包括时间中断

cs 每秒上下文切换次数，例如我们调用系统函数，就要进行上下文切换，线程的切换，也要进程上下文切换，这个值要越小越好，太大了，要考虑调低线程或者进程的数目,例如在apache和nginx这种web服务器中，我们一般做性能测试时会进行几千并发甚至几万并发的测试，选择web服务器的进程可以由进程或者线程的峰值一直下调，压测，直到cs到一个比较小的值，这个进程和线程数就是比较合适的值了。系统调用也是，每次调用系统函数，我们的代码就会进入内核空间，导致上下文切换，这个是很耗资源，也要尽量避免频繁调用系统函数。上下文切换次数过多表示你的CPU大部分浪费在上下文切换，导致CPU干正经事的时间少了，CPU没有充分利用，是不可取的。

us 用户CPU时间，我曾经在一个做加密解密很频繁的服务器上，可以看到us接近100,r运行队列达到80(机器在做压力测试，性能表现不佳)。

sy 系统CPU时间，如果太高，表示系统调用时间长，例如是IO操作频繁。

id 空闲 CPU时间，一般来说，id + us + sy = 100,一般我认为id是空闲CPU使用率，us是用户CPU使用率，sy是系统CPU使用率。

wt 等待IO CPU时间。

参考：

http://www.cnblogs.com/ggjucheng/archive/2012/01/05/2312625.html