问题描述
背景:由于raid控制器的不兼容性问题,我被迫将服务器从Ubuntu 8.04 LTS远程升级到10.04 LTS。
与服务器的Internet连接比较稳定,很少掉线。尽管如此,我还是担心在升级时会丢失通过SSH的连接,从而使服务器处于无法访问的状态。我也担心服务器在升级后无法启动,以防万一我不知道是什么问题。
行动计划:我正在寻找的建议是最大程度地减少丢失服务器的风险,我知道我正在做的事情非常冒险。这是我目前的行动计划:
1)在本地和外部备份所有重要的内容。
2)使用fsck暂时禁用boot-time磁盘检查。 (如果磁盘检查需要很长时间才能完成,我不知道会发生什么情况)。这可以通过将最后一个参数从1更改为0来通过fstab来完成:
UUID=5b1ff964-7608-44fd-a38d-7e43ad6b4c11 / ext3 relatime,errors=remount-ro 0 0
3)从屏幕开始所有升级过程,以便在我断开连接后可以恢复。即:
sudo screen apt-get upgrade
问题:
我提出的行动计划似乎合理吗?
禁用boot-time磁盘是一个坏主意吗?
还可以采取其他措施来降低丢失服务器的风险吗?
更新:几乎所有答案都建议我设置DRAC /IPMI,而现在已经完成了。这感觉像是一个非常伟大的成就,肯定会使风险大大减小,因为我可以通过KVM /控制台重定向来跟踪整个电源周期。供以后参考,这是我所做的:
1)安装了ipmitool来设置IPMI v2.0的IP地址,网关等:
sudo ipmitool lan set 1 ipaddr 192.168.1.99
sudo ipmitool lan set 1 defgw ipaddr 192.168.1.1
2)安装了free-ipmi,将NIC选择模式更改为共享(我只有一个网络接口连接到网络):
sudo ipmi-oem dell set-nic-selection shared
3)使用https://192.168.1.99上的DRAC的https界面启动控制台重定向查看器。这使我可以遵循整个启动顺序以及配置BIOS,RAID控制器等。
更新2.完成。所有人都充满了魅力,不到30分钟就完成了工作。我最终没有关闭磁盘检查,因为重定向的控制台让我可以随时随意中断它,但是我让它运行到最后。
谢谢你们,您的智慧无价!
最佳方案
如果硬件没有损坏,那么串行控制台是您无法做的任何事情,这就是解决方法:
可以远程访问串行控制台(如果系统具有> = IPMI-2.0,则为LAN上的IPMI串行,或者将空调制解调器串行电缆连接到将在其中运行minicom的另一个系统)
配置grub和linux以使用串行控制台
如果可能的话,重定向串行系统的BIOS接口(许多服务器系统都可以这样做)
重新引导系统,并检查您可以使用(BIOS),grub,查看dmesg,查看初始化脚本以及通过串行控制台登录
运行升级
交叉手指
另外,请尽可能将新系统安装在另一个磁盘或分区上,以便您可以在擦除旧系统之前测试新系统。我通常使用两块磁盘系统来执行此操作:我从镜像中取出一个磁盘,使用可用磁盘创建一个新的(降级的)镜像,然后安装在那里,如果一切正常,我将旧镜像销毁,并将hot-add ‘old’磁盘销毁到新磁盘镜像并重建它。
编辑:我读到的是应该具有IPMI2的Dell R710,AFAIK。配置它在系统上本地运行ipmitool,并在另一个系统上使用ipmitool sol enable测试LAN串行功能。砰!您有串行控制台。戴尔还能够在串行控制台上重定向BIOS(该IPMI将依次在serial-over-lan上重定向)。如果确实有任何问题,您还是应该这样做才能访问系统。我使用空调制解调器电缆,BIOS,grub,系统串行控制台和一些Dell R300,以相同的方式管理一对旧的Dell PE1425,但使用LAN上IPMI串行代替实际的串行电缆。