问题:当我们遇到了手机死机问题(hang issue),如何进行处理?

 

如果手机死机,并且没有重启(reboot),可能的原因:

1、             在kernel中,进程中有一些dead lock,同时Android service也堵塞了(blocked),但是time interrupt和dog kick仍然能够running。因此手机没有重启。

2、             Deadlock发生在Android userspace server,如service manager 或者serviceflinger。

 

两种情景抓取log:

1、             adbshell 能够工作

通过adb获取一些信息,如adb bugreport > D:\bugreport.txt。

一些Android framework dead lock可能导致bugreport hang。因此需要先获取一些简单log,如dmesg和logcat log。再进行adb bugreport操作。获取dmesg log之后,通过sysrq 接口获取更多信息。

kernel/Documentation/sysrq.txt
显示 stack for all active CPU
      echo l >/proc/sysrq-trigger
 显示hold lock  
   echo d > /proc/sysrq-trigger
显示 hrtimer
    echo q > /proc/sysrq-trigger

 

disk sleep(uninterruptable sleep)时显示tasks,如阻塞在mutex或者hardware register access。
 echo w > /proc/sysrq-trigger
进行以上trigger后,再次获取dmesg log以防止覆盖。 

 

通过以下trigger获取crash dump

不同平台拥有不同sysfs进入downloade mode的方式,并使能download mode
可能是以下一项:
 echo 1>/sys/module/restart/parameters/download_mode
 echo 1>/sys/module/msm_restart/parameters/download_mode
 echo 1 >/sys/module/msm_poweroff/parameters/download_mode

  如果操作adb bugreport没有block,最后triggercrash。
  echo c> /proc/sysrq-trigger

 

2、             没有枚举adb port或者adb shell不能正常工作

我们需要trigger dump,通过长按power key或者RESET_IN pin(通常连接到powerkey + volume-产生),

需要确保s2-type 配置为1 (warm reset),而不是 7 (hard reset)

 pon_1 is forpower key, pon_3 is for RESET_IN pin
 以8894为例,kernel/arch/arm64/boot/dts/qcom/msm-pm8994.dtsi

qcom,pon_1 {
qcom,pon-type = <0>;
qcom,pull-up = <1>;
linux,code = <116>;
qcom,support-reset = <1>;
qcom,s1-timer = <10256>;
qcom,s2-timer = <2000>;
qcom,s2-type = <1>;
};
qcom,pon_3 {
qcom,pull-up = <1>;
qcom,s1-timer = <6720>;
qcom,s2-timer = <2000>;
qcom,s2-type = <7>;
qcom,use-bark;
};

如果仍然不工作,pull down PS_HOLDin 200ms。