-
linux企业应用分类的最新文章
-
热门文章
-
热评好文
-
最新评论
-
咖啡:道长好文一篇
-
一休:看到新文章了,期待后续精彩分享
-
wx5c370f7991fd9:非常给力
-
sery:是针对虚拟机的,只有加入ha,发生故障才会自动漂移
-
sery:××× ××× 试试
-
最新文章
-
目录
-
四节点组成的proxmox VE超融合集群,连续运行时间超过500天。每个节点除了系统盘而外,由四个单独的2.4T 10000转sas盘做ceph osd。
监控发现,其中一个节点的一块硬盘处于down的状态,尝试修复未获得成功,登录系统,发现系统日志有大量的IO错误,由此判断,一定是硬盘物理损坏。再通知机房,请值班技术帮忙,现场查看硬盘指示灯状态,有一块硬盘常亮红灯,确认故障与判断一致。
由于是在线系统,服务不允许停止,这是最基本的要求。非常幸运的是,proxmox VE去中心化超融合集群,在保证集群得以维持的情况下,可以关掉任意一台或者多台物理服务器(别的超融合平台有控制节点,这个控制节点不能关)。
没有停机担忧以后,做出如下安排:
一切准备妥当之后,风高月黑之夜派人潜入机房,待命。按照计划,进行如下的步骤:
Web管理界面,把故障机运行着的虚拟机的ID号记录下来,然后将其加入到proxmox VE的HA(此高可用与pve集群不同,是建立在pve集群之上的)。
执行下列命令初始化新更换的磁盘:
wipefs -af /dev/sdc
wipefs -af /dev/sdc #sdc为新更换的磁盘设备名称
ceph osd tree
ceph osd tree
赞赏
0人进行了赞赏支持
1
收藏
Ctrl+Enter 发布
发布
取消