当我们在linux下发现进程无法正常启动或者软件的运行速度突然变慢,那么我们如何去诊断问题到底出在什么地方?下面我们通过案例来看下在linux系统下如何去诊断这些疑难杂症。

      在这里我们需要用到linux系统下的两个命令,strace和lltrace,首先我们需要了解下这两个命令分别是做什么的,以及如何使用。

      strace用来跟踪一个进程的系统调用或信号产生的情况,ltrace用来跟踪进程调用库函数的情况。

这2个命令都有以下参数:

     -f :除了跟踪当前进程外,还跟踪其子进程。
     -o file :将输出信息写到文件file中,而不是显示到标准错误输出(stderr)。-

     -p pid :绑定到一个由pid对应的正在运行的进程。此参数常用来调试后台进程。  

   下面我们通过一个实例来说明如何使用这2个命令去解决一些问题。

   1.安装strace和ltrace软件包

使用trace或ltrace 诊断linux下软件的“疑难杂症”_strace

   2.添加一条防火墙策略

使用trace或ltrace 诊断linux下软件的“疑难杂症”_linux_02

   3.查看当前系统的防火墙策略

使用trace或ltrace 诊断linux下软件的“疑难杂症”_strace_03

   4.查看当前服务器的DNS

使用trace或ltrace 诊断linux下软件的“疑难杂症”_linux_04

 

  5.修改当前服务器的DNS

使用trace或ltrace 诊断linux下软件的“疑难杂症”_strace_05

使用trace或ltrace 诊断linux下软件的“疑难杂症”_strace_06

  6.查看当前的防火墙策略

使用trace或ltrace 诊断linux下软件的“疑难杂症”_ltrace_07

这时你会发现么反应非常慢。那么我们如何去发现问题在那呢?请看下面的步骤

   7.用strace命令去追踪下

使用trace或ltrace 诊断linux下软件的“疑难杂症”_linux_08

从标红的地方可能看出,慢是因为卡在域名解析。

  8.用strace去追踪下

使用trace或ltrace 诊断linux下软件的“疑难杂症”_linux_09

 

我们会发现大部分的时间全部浪费在调用这个库函数上。