解决服务器启动中出现”Critical Message”,”Cache data was lost…”报错的问题,联想ThinkSystem,System x及ThinkServer系列服务器 官方原文 http://iknow.lenovo.com/detail/dc_155098.html 故障现象: 所有配备有回写缓存的SAS RAID卡,包括ThinkSystem、System x及ThinkServer系列服务器机型,在启动过程中出现”Critical Message”,”Cache data was lost…”的报错。

注意:不同系列服务器机型报错界面有所不同。

rancher 服务发现 主机网络模式 服务器criticalmessage_服务器

原因分析: 配备有回写缓存的SAS RAID卡在进行写入数据操作时,数据会经过RAID卡缓存再写入到硬盘中。如果数据在未完全写入到硬盘时,服务器发生断电,缓存中未写入部分的数据可能会丢失。待服务器通电启动时,RAID卡自检发现有未完整写入的数据,即出现此报错。

任何非正常关机都可造成此异常,包括:

停电;

手动强制关机;

服务器宕机。

阵列卡缓存数据丢失可能导致操作系统出错、文件损坏,严重时可能造成阵列出错、掉线或者阵列卡进入安全模式。 解决方案: 当出现缓存数据丢失的报错时,通常只能忽略报错,并建议首先检查RAID状态。具体操作如下:

在”Critical Message”界面将光标下移到”Enter Your Input Here:”处,按回车,在输入框中输入字母”A”,再按回车;

rancher 服务发现 主机网络模式 服务器criticalmessage_数据丢失_02

然后会提示”Critical Message handing completed. Please exit.” 处理完成,按ESC键退出;

rancher 服务发现 主机网络模式 服务器criticalmessage_服务器_03

接下来按字母”Y”键继续;

rancher 服务发现 主机网络模式 服务器criticalmessage_服务器_04

随后服务器会继续POST及引导过程,建议在此时进入RAID卡配置界面查看RAID状态,如果RAID状态正常,可以继续正常引导。

如果无法引导系统或者系统报错,可能是缓存数据丢失所导致,需要对系统进行修复或者重新安装。

如果已按照上述进行操作,关机或者重启后依然出现”Critical Message”界面提示,则可能发生硬件故障,建议及时联系售后服务报修。

一些可以降低发生缓存数据丢失问题的方案:

  1. 将Virtual Drive的Write Cache Policy设置为Write Through(直写模式),但此模式会明显降低RAID性能,特别是RAID5和RAID6;
  2. 加装、配备电池(BBU)或者闪存备份单元(Flash Backup Write Cache及Super Capacitor);
  3. 配备UPS(不间断电源)。

华为2288 3508阵列卡在控制台显示不可用时,在设备健康项目里,输入字母d 即可将阵列卡缓存中数据清理,置阵列卡为健康正常可用状态。

解决服务器启动中出现”Critical Message”,”Cache data was lost…”报错的问题,联想ThinkSystem,System x及ThinkServer系列服务器 官方原文 http://iknow.lenovo.com/detail/dc_155098.html 故障现象: 所有配备有回写缓存的SAS RAID卡,包括ThinkSystem、System x及ThinkServer系列服务器机型,在启动过程中出现”Critical Message”,”Cache data was lost…”的报错。

注意:不同系列服务器机型报错界面有所不同。

rancher 服务发现 主机网络模式 服务器criticalmessage_服务器

原因分析: 配备有回写缓存的SAS RAID卡在进行写入数据操作时,数据会经过RAID卡缓存再写入到硬盘中。如果数据在未完全写入到硬盘时,服务器发生断电,缓存中未写入部分的数据可能会丢失。待服务器通电启动时,RAID卡自检发现有未完整写入的数据,即出现此报错。

任何非正常关机都可造成此异常,包括:

  1. 停电;
  2. 手动强制关机;
  3. 服务器宕机。

阵列卡缓存数据丢失可能导致操作系统出错、文件损坏,严重时可能造成阵列出错、掉线或者阵列卡进入安全模式。 解决方案: 当出现缓存数据丢失的报错时,通常只能忽略报错,并建议首先检查RAID状态。具体操作如下:

在”Critical Message”界面将光标下移到”Enter Your Input Here:”处,按回车,在输入框中输入字母”A”,再按回车;

rancher 服务发现 主机网络模式 服务器criticalmessage_数据丢失_02

然后会提示”Critical Message handing completed. Please exit.” 处理完成,按ESC键退出;

rancher 服务发现 主机网络模式 服务器criticalmessage_服务器_03

接下来按字母”Y”键继续;

rancher 服务发现 主机网络模式 服务器criticalmessage_服务器_04

随后服务器会继续POST及引导过程,建议在此时进入RAID卡配置界面查看RAID状态,如果RAID状态正常,可以继续正常引导。

如果无法引导系统或者系统报错,可能是缓存数据丢失所导致,需要对系统进行修复或者重新安装。

如果已按照上述进行操作,关机或者重启后依然出现”Critical Message”界面提示,则可能发生硬件故障,建议及时联系售后服务报修。

一些可以降低发生缓存数据丢失问题的方案:

  1. 将Virtual Drive的Write Cache Policy设置为Write Through(直写模式),但此模式会明显降低RAID性能,特别是RAID5和RAID6;
  2. 加装、配备电池(BBU)或者闪存备份单元(Flash Backup Write Cache及Super Capacitor);
  3. 配备UPS(不间断电源)。

华为2288 3508阵列卡在控制台显示不可用时,在设备健康项目里,输入字母d 即可将阵列卡缓存中数据清理,置阵列卡为健康正常可用状态。