安装报错来源于下面的配置部署集群过程中出现的问题:

 

在MAC笔记本创建的虚拟机,完成的ceph集群部署测试,使用cephadm,完成ceph的容器化部署安装

ceph 第几版开始容器化版 ceph 15.2_时间同步

 


 

 

 

 

1. 安装报错以及解决方案参考

1.1. ceph安装ceph-common报错

1.1.1. 故障详情

直接yum安装ceph-common 一直提示类似的报错,然后
换了各种网易、阿里云、清华源都不行,最后加了一个mysql的源,才可以顺利安装

提示的是mysql的相关的模块,所以最后尝试加上mysql的源安装去安装

ceph 第几版开始容器化版 ceph 15.2_时间同步_02

 

是可以成功安装,但是安装后的ceph版本是前文提示的10.2的版本,最终导致cephadm初始化后,出现这样的报错

ceph 第几版开始容器化版 ceph 15.2_解决方案_03

 

 

 

 

1.1.2. 解决方案 

检查并且更换yum源去安装,而且安装完成后ceph -v看看版本,确认是15.2.13 再去安装其它节点的ceph

 

1.2. ceph 节点添加失败 

1.2.1. 故障详情

 

1、正常安装完成后,开始添加节点,但是一添加就报这样的提示错误,看着就一脸懵逼:

[root@ceph-1 ~]# ceph orch host add ceph-3

Error EINVAL: New host ceph-3 (ceph-3) failed check: 
['podman|docker (/bin/docker) is present', 'systemctl is present', 'lvcreate is present', 
"No time sync service is running; checked for ['chrony.service', 'chronyd.service', 
'systemd-timesyncd.service', 'ntpd.service', 'ntp.service', 'ntpsec.service']", 
'Hostname "ceph-3" matches what is expected.', 'ERROR: No time synchronization is active']

ceph 第几版开始容器化版 ceph 15.2_解决方案_04

 

 

 

  

1.2.2. 解决方法

1、造成这个故障的成因有以下几个,请一一去排查解决

检查时间同步,确认ceph服务器直接的时间一致,ntp有配置且开启了;

检查是否做了免密,是否可以主机名登录;

检查是否将ceph.pub发送给ceph-3了;

检查ceph-3 是否有开防火墙策略还有selinux配置是否disable

 

1.2.3. 故障详情 

有时候添加节点会出现这样的告警报错,这个一般是权限问题导致:

[root@ceph-1 ~]# ceph orch host add ceph-3

Error EINVAL: Failed to connect to ceph-3 (ceph-3).

Please make sure that the host is reachable and accepts connections using the cephadm SSH key

 

To add the cephadm SSH key to the host:

> ceph cephadm get-pub-key > ~/ceph.pub

> ssh-copy-id -f -i ~/ceph.pub root@ceph-3

 

To check that the host is reachable:

> ceph cephadm get-ssh-config > ssh_config

> ceph config-key get mgr/cephadm/ssh_identity_key > ~/cephadm_private_key

> chmod 0600 ~/cephadm_private_key

> ssh -F ssh_config -i ~/cephadm_private_key root@ceph-3

 

1.2.4. 解决方案 

一般有两个方法参考解决:
直接执行截图提示的命令,然后再添加看看,

 

 

再次执行下面的命令,然后检查是否做好了免密和hosts文件修改
ssh-copy-id -f -i /etc/ceph/ceph.pub root@ceph-3

 

1.3.1. 故障详情

1.3. ceph集群时间同步异常

节点重启后有时候会出现这个时间同步问题,该测试集群主要是跟ceph-1的时间同步

ceph 第几版开始容器化版 ceph 15.2_时间同步_05

 

 

 

 1.3.2. 解决方案

在ceph-2 和ceph-3 上面重新手动执行时间同步命令,再等5分钟左右,若是ntp正常启动,一般ceph集群的clock告警就会自动消失。