一、NMON中的各项参数指标:
SYS_SUMM:显示当前服务器的总体性能情况
Total System I/OStatistics:
Avg tps during an interval:显示采集间隔内磁盘*均I/O次数,该值等于Sheet DISK_SUMM中IO/sec列的*均值。
Max tps during an interval:显示采集间隔内磁盘最大I/O次数,该值等于Sheet DISK_SUMM中IO/sec列的最大值。
Max tps interval time:显示磁盘最大I/O所在时间点。
Total number of Mbytes read:显示采集间隔内磁盘读的总兆字节数,可能是nmon的bug,该值并不准确,并且使用LVM划分的虚拟磁盘可能会存在重复统计。
Total number of Mbytes written:显示采集间隔内磁盘写的总兆字节数,该值并不准确,理由同上。
以上两个值采集的时候可能还会出现负数,如果有必要可以重新进行压测采集,但是不能以该两个值作为标准。
Read/Write Ratio:显示Total number of Mbytes read/ Total number of Mbytes written的值。 实时读写比率
IO/sec:仅显示磁盘IO/sec的图,不包括Network的I/O。 每秒钟输出到物理磁盘的传输次数
右侧CPU
CPU:
Users%:显示采集间隔内所有CPU在User Mode下的Time占比(Avg、Max)。
Sys%:显示采集间隔内所有CPU在System Mode下的Time占比(Avg、Max)。
Wait%:显示采集间隔内所有CPU处于空闲且等待I/O完成的时间比例(Wait%是CPU空闲状态的一种,当CPU处于空闲状态而又有进程处于D状态(不可中断睡眠)时,系统会统计这时的时间,并计算到Wait%里),Wait%不是一个时间值,而是时间的比例,因此在同样I/O Wait时间下,服务器CPU越多,Wait%越低,它体现了I/O操作与计算操作之间的比例。对I/O密集型的应用来说一般Wait%较高,且Sheet PROC中Blocked也较高,这时需关注是什么导致了过多的进程等待。
Idle%:显示采集间隔内所有CPU处于空闲Time的占比(Avg、Max)。
CPU%:显示采集间隔内所有CPU的user%+system%。
DISK_SUMM
按采集时间显示所有磁盘和分区的Read/Write的速率(KB/s)和所有磁盘和分区的I/O率。某一采集时间点的IO/sec等于Sheet DISKXFER中该时间点上所有磁盘和分区的IO/sec之和。因此,这一时间点上的I/O值是重复的!另外,本Sheet中的I/O不包括NFS里的I/O。
如上图的WAvg按nmon Guide中的说法是为了去掉采集值中的零值以便贴*真实*均值,但WAvg的公式(对计算列中所有值取*方后加合,再除以列中所有值之和)却不是单纯的去掉零值,这里可以理解为WAvg比Avg更贴*资源消耗的均值,因此以后所有资源Sheet中都推荐关注WAvg。
IBM Redpaper《Linux Performance and Tuning Guidelines》中介绍Linux的I/O子系统架构如下:
nmon(包括iostat)对系统I/O的指标截取大部分来自/proc/diskstats,而这些值来自block layer层,LVM里的Logical Volume会“visible as a standard block device”,因此真实的磁盘,LVM的逻辑卷,分区等在这里都会显示,在nmon计算总值时会被重复统计。
Disk Read/Write KB是同一采集时间点下Sheet DISKREAD、DISKWRITE里该行(所有磁盘和分区)数值之和,必然包括了重复值,例如某一时刻sda磁盘共write 1000 KB,其中sda1分区write 700 KB,sda3分区write 300 KB,这一时刻Disk Write应是1000 KB,但这里却会重复统计分区数值,导致显示为Disk Write 2000 KB。Disk I/O也存在同样的问题!
MENM页面:该页面包含了如下图各监控时间点内存各方面的信息数据和图表,主要信息如下:
- memtoatl:服务器总内存,单位M;
- swaptotal:虚拟总内存;
- memfree:剩余总内存;
- swapfree:剩余虚拟内存;