现象场景:

        客户反馈,云服务器蓝屏,无法登录使用,如下图所示。由于蓝屏的分析需要较长的时间,为了让客户可以快速恢复业务,建议重启云服务器。

云服务器蓝屏,重启后进入系统恢复界面_蓝屏

 以Windows服务器为例,会遇到一种情况,就是重启后,无法正常载入系统的情况,会看到"系统恢复"界面,如下图所示。

云服务器蓝屏,重启后进入系统恢复界面_蓝屏_02

问题分析:

        当云服务器进入到"系统恢复"界面的时候,说明此时系统已无法维持正常运转。原因有很多,比如注册表损坏,系统文件损坏,云服务器出现问题等等。这些情况,很多时候是由安装的第三方杀毒软件,误操作,异常重启,第三方应用软件引起的。

       按照"系统恢复"界面引导操作,会进入到Windows的修复模式,查阅了微软的官方文档,解释为当计算机无法启动时,Windows 会自动进入修复模式,Windows RE 中的启动修复工具可自动诊断和修复无法启动的 Windows 安装。

       微软的初心是好的,但是,很多时候会因为系统损坏过于严重而无法恢复。

       再来说说什么是蓝屏,蓝屏又称为蓝屏死机,微软官方说法是,指微软的Windows操作系统没有办法从错误中恢复过来,或者已经达到不能安全操作的状态,为保护数据不被破坏而强制显示的界面。

       导致蓝屏的原因主要有:

              Windows内核态程序出错

              操作系统文件,注册表的损坏

             杀毒软件导致的异常

            病毒感染

             第三方软件和系统不兼容

            硬件损坏

            资源不足

蓝屏界面,最直观的就是蓝屏错误码,文章一开始放的第一张图,0x0000005C,查阅微软官方文档得知,对应为HAL_INITIALIZATION_FAILED,如图所示,那么蓝屏错误码对应的意义,欢迎查阅微软官方文档,链接为https://docs.microsoft.com/en-us/windows-hardware/drivers/debugger/bug-check-code-reference2

云服务器蓝屏,重启后进入系统恢复界面_蓝屏_03

问题解决:

        1、发生蓝屏,最快速恢复业务的方法,就是重启。但最好的方法就是预防蓝屏,可以参考下列方法进行操作:

               定时创建系统盘和数据盘快照

               定期运行系统更新,确保当前系统安装了最新的更新包

               使用商业版本的杀毒软件,并定期更新杀毒软件

               尽量使用数据盘保护数据系统,并定期备份

               避免修改不了解的系统文件,注册表。若确实需要修改,请先备份

       2、如果云服务器频繁发生蓝屏,大概率为底层物理机出现问题,建议云服务器迁移至其他底层物理机。

       3、如果重启可以恢复成功,建议进入系统后,运行有管理员权限的CMD, 输入 sfc /scannow 进行系统完整性的检查和修复