1、故障现象

今天下午看到群友在说一个问题,说ceph的某个osd处于down的状态,我大概整理下他的处理过程

1、查看OSD的状态
记一次Ceph日志损坏的分析处理过程
2、查看日志信息
记一次Ceph日志损坏的分析处理过程
3、启动对应的ceph-osd服务
记一次Ceph日志损坏的分析处理过程
4、检查集群健康状态
记一次Ceph日志损坏的分析处理过程

2、日志损坏了,如何让osd重新上线

思路:重建日志
a、先把/var/lib/ceph/osd/ceph-61/journal 日志删掉
b、重建日志ceph-osd -i 61 --mkjournal
记一次Ceph日志损坏的分析处理过程