安装报错来源于下面的配置部署集群过程中出现的问题:
在MAC笔记本创建的虚拟机,完成的ceph集群部署测试,使用cephadm,完成ceph的容器化部署安装
1. 安装报错以及解决方案参考
1.1. ceph安装ceph-common报错
1.1.1. 故障详情
直接yum安装ceph-common 一直提示类似的报错,然后
换了各种网易、阿里云、清华源都不行,最后加了一个mysql的源,才可以顺利安装
提示的是mysql的相关的模块,所以最后尝试加上mysql的源安装去安装
是可以成功安装,但是安装后的ceph版本是前文提示的10.2的版本,最终导致cephadm初始化后,出现这样的报错
1.1.2. 解决方案
检查并且更换yum源去安装,而且安装完成后ceph -v看看版本,确认是15.2.13 再去安装其它节点的ceph
1.2. ceph 节点添加失败
1.2.1. 故障详情
1、正常安装完成后,开始添加节点,但是一添加就报这样的提示错误,看着就一脸懵逼:
[root@ceph-1 ~]# ceph orch host add ceph-3
Error EINVAL: New host ceph-3 (ceph-3) failed check:
['podman|docker (/bin/docker) is present', 'systemctl is present', 'lvcreate is present',
"No time sync service is running; checked for ['chrony.service', 'chronyd.service',
'systemd-timesyncd.service', 'ntpd.service', 'ntp.service', 'ntpsec.service']",
'Hostname "ceph-3" matches what is expected.', 'ERROR: No time synchronization is active']
1.2.2. 解决方法
1、造成这个故障的成因有以下几个,请一一去排查解决
检查时间同步,确认ceph服务器直接的时间一致,ntp有配置且开启了;
检查是否做了免密,是否可以主机名登录;
检查是否将ceph.pub发送给ceph-3了;
检查ceph-3 是否有开防火墙策略还有selinux配置是否disable
1.2.3. 故障详情
有时候添加节点会出现这样的告警报错,这个一般是权限问题导致:
[root@ceph-1 ~]# ceph orch host add ceph-3
Error EINVAL: Failed to connect to ceph-3 (ceph-3).
Please make sure that the host is reachable and accepts connections using the cephadm SSH key
To add the cephadm SSH key to the host:
> ceph cephadm get-pub-key > ~/ceph.pub
> ssh-copy-id -f -i ~/ceph.pub root@ceph-3
To check that the host is reachable:
> ceph cephadm get-ssh-config > ssh_config
> ceph config-key get mgr/cephadm/ssh_identity_key > ~/cephadm_private_key
> chmod 0600 ~/cephadm_private_key
> ssh -F ssh_config -i ~/cephadm_private_key root@ceph-3
1.2.4. 解决方案
一般有两个方法参考解决:
直接执行截图提示的命令,然后再添加看看,
再次执行下面的命令,然后检查是否做好了免密和hosts文件修改
ssh-copy-id -f -i /etc/ceph/ceph.pub root@ceph-3
1.3.1. 故障详情
1.3. ceph集群时间同步异常
节点重启后有时候会出现这个时间同步问题,该测试集群主要是跟ceph-1的时间同步
1.3.2. 解决方案
在ceph-2 和ceph-3 上面重新手动执行时间同步命令,再等5分钟左右,若是ntp正常启动,一般ceph集群的clock告警就会自动消失。