前言
- 系统:Centos
- 环境:测试环境
- 服务器类型:联想(ThinkServer)塔式服务器 TS250
- 测试童鞋反馈系统很卡,保存数据非常非常慢,第一反应是重启应用及数据库,不一会说还是非常慢,还是使用了重启大法,直接把服务器重启了,最后发现还是没解决问题。
- 然后定位到是mysql写入数据很慢问题,又倒腾了大半天,主从同步,binlog日志清理等等,最终还是没解决问题,偶然发现服务器编辑保存文件都很慢,恍然大悟可能是服务器磁盘IO占比比较高,需要找出占比比较高的那个PID。
- 执行命令:iotop -oP
插个题外话,最终这个问题似乎也没解决
先说说用到哪些命令
- 如果没有 iostat 命令,那么使用 yum install sysstat 进行安装
- iostat -x 1 10
字段说明
- Device:设备名称
- tps:每秒的IO读、写请求数量,多个逻辑请求可以组合成对设备的单个I/O请求。
- Blk_read/s (kB_read/s, MB_read/s):从设备读取的数据量,以每秒若干块(千字节、兆字节)表示。块相当于扇区,因此块大小为512字节。
- Blk_wrtn/s (kB_wrtn/s, MB_wrtn/s):写入设备的数据量,以每秒若干块(千字节、兆字节)表示。块相当于扇区,因此块大小为512字节。
- Blk_read (kB_read, MB_read):读取块的总数(千字节、兆字节)。
- Blk_wrtn (kB_wrtn, MB_wrtn):写入块的总数(千字节,兆字节)。
- rrqm/s:每秒合并到设备的读请求数。即delta(rmerge)/s
- wrqm/s:每秒合并到设备的写入请求数。即delta(wmerge)/s
- r/s:每秒完成的读I/O设备次数。即delta(rio)/s
- w/s:每秒完成的写I/0设备次数。即delta(wio)/s
- rsec/s (rkB/s, rMB/s):每秒读取设备的扇区数(千字节、兆字节)。每扇区大小为512字节
- wsec/s (wkB/s, wMB/s):每秒写入设备的扇区数(千字节、兆字节)。每扇区大小为512字节
- avgrq-sz:平均每次设备I/O操作的数据量(扇区为单位)。即delta(rsec+wsec)/delta(rio+wio)
- avgqu-sz:平均每次发送给设备的I/O队列长度。
- await:平均每次IO请求等待时间。(包括等待队列时间和处理时间,毫秒为单位)
- r_await:平均每次IO读请求等待时间。(包括等待队列时间和处理时间,毫秒为单位) w_await:平均每次IO写请求等待时间。(包括等待队列时间和处理时间,毫秒为单位)
- svctm:平均每次设备I/O操作的处理时间(毫秒)。警告!不要再相信这个字段值,这个字段将在将来的sysstat版本中删除。
- %util:一秒中有百分之多少的时间用于I/O操作,或者说一秒中有多少时间I/O队列是非空的。当该值接近100%时,设备饱和发生。
找到IO占用高的进程
- 通过 iotop 命令
- 如果没有该命令,请通过yum install iotop进行安装。
- iotop -oP
接到上面说的我的问题并没有解决
- 发现我这个IO占用比较高是 md126_raid1 这根本不是我运行的应用呀。
- 又倒腾半天,查阅各种资料(百度都快搜烂啦) ,这是我的各种搜索历史
- 最终确定为是不是前两天突然断电造成服务器磁盘损坏问题。
- 此时联系到了联想的售后工程师,又是一顿沟通,最终确定磁盘是好的。
- 然后IO占用100%也没最终的答案,就说可能是断电导致的问题,
- 建议备份数据重装系统(说了等于白说)。。。。
最终也没解决,难道只有重装系统吗???
- 有木有大佬帮帮小弟的。