dmesg 检测硬件信息

由于dmesg命令的输出实在太长了,在其中搜索某个特定的字符串是非常困难的,因此有必要过滤一些包含‘usb’ ‘dma’ ‘tty’ ‘memory’等字符串的日志行。grep 命令 的‘-i’选项表示忽略大小写。 

 1.[root@tecmint.com log]# dmesg | grep -i usb
 2.[root@tecmint.com log]# dmesg | grep -i dma
 3.[root@tecmint.com log]# dmesg | grep -i tty
 4.[root@tecmint.com log]# dmesg | grep -i memory


 

iostat -c 检测cpu信息

us用户状态所占百分比
sy系统(内核)状态所占百分比
wt/wa 系统等待磁盘IO所占时间百分比(此时cpu闲置)

id空闲时间所占百分比

 


 


vmstat 显示系统状况

kthr内核线程状态

r:当前在队列中等待执行的线程数

b:当前队列中处于等待状态的线程,由于IO(存储、网络)操作未完成,无法继续执行,必须挂起

w: 被交换出去的可运行的进程数。此数由 linux 计算得出,但 linux 并不耗尽交换空间

 

memory内存:关于使用虚拟内存和实内存的信息。如果虚拟页已经被访问的话,虚拟页可以被认为是活动的。一页为4096个字节。
avm:Active memory ,它等于当前使用的物理内存和使用的交换区的总和减去作为文件系统缓存的物理内存,单位为4KB,即一个内存页。

swap可用的交换内存(K表示)

free:空闲的物理内存,单位为4KB。

swpd虚拟内存使用情况单位KB

buff被用来做为缓存的内存数,单位KB

 

page页:以秒为单位报告缺页和分页活动

pi:在vmstat两次检查间隔期间,系统将磁盘交换区读回物理内存页的数量,通常多是内存不够的表现。

po:在vmstat两次检查间隔期间,系统将物理内存页交换到磁盘的数量。越多代表系统内存紧张,但偶尔出先的pi,po并不能说明任何问题,而且通常系统大量文件操作(例如文件系统备份/恢复,tar操作等)往往伴随着大量的pi,po,这都是正常现象

re:回收的页面 ,数值长期趋近于1,并且pi,po都很大,说明系统可能有thrash(抖动)的现象,即刚交换出去的内存马上又需要使用,必须交换回来,物理内存可能严重不足。

fr:代表在此段时间内,有多少不使用的物理内存被释放,可能是内存页被程序释放,也可能是已经将其内存交换到磁盘。

sr:代表在此段时间内,由于有内存使用申请,而物理内存空闲不足,进行有多内存页搜索被检查的页数。此数值越大,代表内存申请越多,也就是内存需求量比较大

cy:进行内存搜索、清理消耗的时钟周期,此数值越大,说明内存越紧张,操作系统用了过多的时间进行内存清理。当然,也有可能系统内的程序调度(起/停)过于频繁。如论如何,cy多大都说明当前内存使用、管理方面需要仔细分析。

mf非严重错误的页面

swap
si从磁盘交换到内存的交换页数量,,单位:KB/秒
so从内存交换到磁盘的交换数量 单位KB/秒
io
bi发送到块设备的块数,单位,块/秒
bo从块设备接收到的块数,单位:块/秒

mf非严重错误的页面

de 最近换入的进程所需的预计内存

 

 

disk显示每秒的磁盘操作。 s表示scsi盘  0表示盘号,最多显示四个磁盘中的数据

 

 

fault故障:采样间隔平均的捕获和中断率。

in中断次数,在此段时间内各种不同原因产生的中断次数,包括时钟中断,中断的原因可能是cpu处理时间片到期、设备IO产生中断等。vmstat -i可以查看更详细的关于中断的信息

cs每秒的环境(上下文)切换次数,对于一个CPU,当正在执行的线程与即将执行的线程不是同一个的时候,就会产生一个cs(content switch)

sy(在faults区的sy)此时间段内系统调用次数,用户程序执行过程中发出系统执行调用申请,以便普通用户请求核心操作,例如进行磁盘io等操作

 

 

 

cpu  表示cpu的使用状态

us:用户进程使用的时间百分比

sy(在cpu区的sy)系统进程使用的时间百分比

id cpu空闲的时间百分比

id cpu空闲的时间

wa系统等待磁盘IO所占时间百分比(此时cpu闲置)

在进行了CPU共享(需要POWER5、6机型,并购买微分区功能才支持)的机器上,还另外两项,pc和ec,pc代表实际分配给次分区的CPU数量(可能是小数,以1%为单位),而ec代表授权此分区使用CPU的数量与实际使用的比例(超出100时说明当前分区临时抢占使用了超过了指派给它的CPU资源)

 

 

 

如果r经常大于4,且id经常少于40,表示cpu的负荷很重。
如果pi,po长期不等于0,表示内存不足
如果disk经常不等于0,且b中的列队大于3,表示io性能不好

 


 


iostat -xnm io监控
1ksh# iostat -xnm
                    extended device statistics             
    r/s    w/s   kr/s   kw/s wait actv wsvc_t asvc_t  %w  %b device
    0.2    3.3    2.1   19.0  0.0  0.1    1.5   26.1   1   4 md/d100 (/)
    0.1    3.3    1.0   19.0  0.0  0.1    0.0   23.0   0   3 md/d101
    0.1    3.3    1.0   19.0  0.0  0.1    0.0   20.1   0   3 md/d102
    0.0    0.0    0.0    0.0  0.0  0.0    0.0    0.0   0   0 md/d110
    0.0    0.0    0.0    0.0  0.0  0.0    0.0    0.2   0   0 c0t0d0
    0.4   68.4    7.4  247.6  0.0  0.8    0.0   11.4   0  47 c2t0d0
    4.1    4.0    0.2    0.2  0.0  0.0    0.0    0.0   0   0 c6t600C0FF0000000000A740739498D4300d0
   13.4   11.0  306.4 3938.2  0.0  0.9    0.2   38.9   0  21 c6t600C0FF0000000000A74073986361500d0
    0.4   68.4    7.4  247.6  0.0  0.6    0.0    9.1   0  41 c2t1d0
    0.0    0.0    0.0    0.0  0.0  0.0    0.0    3.8   0   0 lasamaster:vold(pid543)
extended device statistics 扩展设备统计
r/s、w/s:每秒的读写次数
kr/s、kw/s:每秒的读写字节数(KB为单位)
wait 平均有多少事务在等待处理(队列的长度)
actv:平均有多少事务正在处理中(已从列队中删除,但仍未完成) 
w/asvc_t:事务平均响应时间(毫秒为单位),包括了等待时间和服务时间
w%事务等待处理的时间百分比
b磁盘忙碌的时间百分比
device磁盘标识