Ceph节点安装

  预检

  我们建议安装一个 ceph-deploy 管理节点和一个三节点的Ceph 存储集群来研究 Ceph 的基本特性。这篇预检会帮你准备一个 ceph-deploy 管理节点、以及三个Ceph 节点(或虚拟机),以此构成 Ceph 存储集群。在进行下一步之前,请参见操作系统推荐以确认你安装了合适的 Linux 发行版。如果你在整个生产集群中只部署了单一 Linux 发行版的同一版本,那么在排查生产环境中遇到的问题时就会容易一点。

  在下面的描述中节点代表一台机器。

Ceph节点安装(快速)_centos

 

 

主机名 角色 系统 IP 备注

node1

mon.node1 CentOS7.5 192.168.1.101  

node2

osd.0 CentOS7.5 192.168.1.102 osd节点需配置数据盘
例如/dev/sdb
node3 ods.1 CentOS7.5 192.168.1.103

osd节点需要配置数据盘

例如/dev/sdb

admin-node ceph-deploy CentOS7.5 192.168.1.104  

  安装ceph部署工具

  在节点admin-node 部署

  设置yum源

  设置国内阿里源(node1 node2 node3设置yum源和admin-node一致)

  如果需要设置其他版本可以查看http://mirrors.aliyun.com/ceph

[root@admin-node ~]#cat /etc/yum.repos.d/ceph.repo
[ceph]
name=ceph
baseurl=http://mirrors.aliyun.com/ceph/rpm-nautilus/el7/x86_64/
enabled=1
gpgcheck=0
priority=1
 
[ceph-noarch]
name=cephnoarch
baseurl=http://mirrors.aliyun.com/ceph/rpm-nautilus/el7/noarch/
enabled=1
gpgcheck=0
priority=1
 
[ceph-source]
name=Ceph source packages
baseurl=http://mirrors.aliyun.com/ceph/rpm-nautilus/el7/SRPMS
enabled=1
gpgcheck=0
priority=1

   更新仓库安装ceph-deploy

sudo yum update -y && sudo yum install ceph-deploy -y

   Ceph节点安装

  你的管理节点必须能够通过 SSH 无密码地访问各 Ceph 节点。如果 ceph-deploy 以某个普通用户登录,那么这个用户必须有无密码使用 sudo 的权限。

  设置NTP同步(所有主机执行)

  安装NTP

  Ceph集群对时间一致要求很高,需要设置ntp时间同步

yum -y install ntpdate

   时间同步

ntpdate time1.aliyun.com

   设置在定时任务crontab执行时间同步

crontab -e
#添加一下内容
*/5 * * * * /usr/sbin/ntpdate time1.aliyun.com

   设置管理节点免密登录ceph节点

  生成密钥对

ssh-keygen

   把公钥拷贝至各ceph的node节点

  使用主机名拷贝需要事先设置好主机hosts

ssh-copy-id node1
ssh-copy-id node2
ssh-copy-id node3

   关闭firewalld和senlinux

  

  存储集群快速入门

  如果你还没完成预检,请先做完。本篇快速入门用 ceph-deploy 从管理节点建立一个 Ceph 存储集群,该集群包含三个节点,以此探索 Ceph 的功能。

Ceph节点安装(快速)_元数据_02

 

   第一次练习时,我们创建一个 Ceph 存储集群,它有一个 Monitor 和两个 OSD 守护进程。一旦集群达到 active clean 状态,再扩展它:增加第三个 OSD 、增加元数据服务器和两个 Ceph Monitors。为获得最佳体验,先在管理节点上创建一个目录,用于保存 ceph-deploy 生成的配置文件和密钥对。

  

mkdir my-cluster
cd my-cluster/

   创建集群

  如果在某些地方碰到麻烦,想从头再来,可以用下列命令清除配置:

ceph-deploy purgedata {ceph-node} [{ceph-node}]#清除ceph数据
ceph-deploy forgetkeys #清除key

   用下列命令可以连 Ceph 安装包一起清除:

ceph-deploy purge {ceph-node} [{ceph-node}]

   如果执行了 purge ,你必须重新安装 Ceph。

  在管理节点上,进入刚创建的放置配置文件的目录,用 ceph-deploy 执行如下步骤。

  1,创建集群

ceph-deploy new {initial-monitor-node(s)}

   例如

ceph-deploy new node1

  在当前目录下用 ls 和 cat 检查 ceph-deploy 的输出,应该有一个 Ceph 配置文件、一个 monitor 密钥环和一个日志文件。

  2,把 Ceph 配置文件里的默认副本数从 3 改成 2 ,这样只有两个 OSD 也可以达到 active clean 状态。把下面这行加入 [global] 段:

osd pool default size = 2

   3,如果你有多个网卡,可以把 public network 写入 Ceph 配置文件的 [global] 段下。

public network = {ip-address}/{netmask}

   类似于192.168.1.0/24

  4,安装Ceph

ceph-deploy install {ceph-node} [{ceph-node} ...]

   例如

ceph-deploy install admin-node node1 node2 node3

   ceph-deploy 将在各节点安装 Ceph 。 注:如果你执行过 ceph-deploy purge ,你必须重新执行这一步来安装 Ceph 。

  执行该步骤会分别连接对应客户端安装ceph,ceph-radosgw会在对应客户端下载yum源文件

# cat /etc/yum.repos.d/ceph.repo 
[Ceph]
name=Ceph packages for $basearch
baseurl=http://download.ceph.com/rpm-mimic/el7/$basearch
enabled=1
gpgcheck=1
type=rpm-md
gpgkey=https://download.ceph.com/keys/release.asc
priority=1

[Ceph-noarch]
name=Ceph noarch packages
baseurl=http://download.ceph.com/rpm-mimic/el7/noarch
enabled=1
gpgcheck=1
type=rpm-md
gpgkey=https://download.ceph.com/keys/release.asc
priority=1

[ceph-source]
name=Ceph source packages
baseurl=http://download.ceph.com/rpm-mimic/el7/SRPMS
enabled=1
gpgcheck=1
type=rpm-md
gpgkey=https://download.ceph.com/keys/release.asc
priority=1

   注意:使用admin节点给客户端安装ceph速度较慢,如果客户端网络好可以直接设置好yum源安装

yum -y update && yum -y install ceph ceph-radosgw

   会在各个安装的节点创建目录

/etc/ceph/

   目录下有一个文件

[root@localhost ceph]# cat rbdmap 
# RbdDevice		Parameters
#poolname/imagename	id=client,keyring=/etc/ceph/ceph.client.keyring

 

  安装好以后使用命令查看版本

# ceph -v
ceph version 14.2.10 (b340acf629a010a74d90da5782a2c5fe0b54ac20) nautilus (stable)

   5,配置初始 monitor(s)、并收集所有密钥:

ceph-deploy mon create-initial

   完成上述操作后,当前目录里应该会出现这些密钥环:

{cluster-name}.client.admin.keyring
{cluster-name}.bootstrap-osd.keyring
{cluster-name}.bootstrap-mds.keyring
{cluster-name}.bootstrap-rgw.keyring

 Ceph节点安装(快速)_服务器_03

 

   

  添加OSD

  1,添加两个 OSD 。

ceph-deploy osd create --data {dev} {node_name}

   例如

ceph-deploy osd create --data /dev/sdb node2
ceph-deploy osd create --data /dev/sdb node3

   2,用 ceph-deploy 把配置文件和 admin 密钥拷贝到管理节点和 Ceph 节点,这样你每次执行 Ceph 命令行时就无需指定 monitor 和 ceph.client.admin.keyring 了。

ceph-deploy admin {admin-node} {ceph-node}

   例如

ceph-deploy admin admin-node node1 node2 node3

   会修改对应node的配置文件以及添加key

Ceph节点安装(快速)_配置文件_04

 

   3,检查集群健康状态

[root@admin-node my-cluster]# ceph -s
  cluster:
    id:     8dc0f409-70c1-4499-94a9-466abdf4f30d
    health: HEALTH_WARN
            no active mgr
 
  services:
    mon: 1 daemons, quorum node1 (age 29m)
    mgr: no daemons active
    osd: 2 osds: 2 up (since 7m), 2 in (since 7m)
 
  data:
    pools:   0 pools, 0 pgs
    objects: 0 objects, 0 B
    usage:   0 B used, 0 B / 0 B avail
    pgs:     

   扩展集群

  一个基本的集群启动并开始运行后,下一步就是扩展集群。在 node1 上添加一个 OSD 守护进程和一个元数据服务器。然后分别在 node2 和 node3 上添加 Ceph Monitor ,以形成 Monitors 的法定人数。

  扩展前

Ceph节点安装(快速)_元数据_02

  

  扩展后

Ceph节点安装(快速)_服务器_06

 

   添加OSd

  你运行的三个节点集群只是用于演示,把OSD添加到monitor节点就行

  添加前查看

Ceph节点安装(快速)_元数据_07

 

   添加OSD

ceph-deploy osd create --data /dev/sdb node1

   添加后查看

Ceph节点安装(快速)_centos_08

 

  添加元数据服务器

  至少需要一个元数据服务器才能使用 CephFS ,执行下列命令创建元数据服务器:

ceph-deploy mds create {ceph-node}

   例如

ceph-deploy mds create node1

   查看

[root@admin-node my-cluster]# ceph -s
  cluster:
    id:     8dc0f409-70c1-4499-94a9-466abdf4f30d
    health: HEALTH_WARN
            no active mgr
 
  services:
    mon: 1 daemons, quorum node1 (age 2h)
    mgr: no daemons active
    mds:  1 up:standby #新建的mds服务
    osd: 3 osds: 3 up (since 12m), 3 in (since 12m)
 
  data:
    pools:   0 pools, 0 pgs
    objects: 0 objects, 0 B
    usage:   0 B used, 0 B / 0 B avail
    pgs:     

   

Note 当前生产环境下的 Ceph 只能运行一个元数据服务器。你可以配置多个,但现在我们还不会为多个元数据服务器的集群提供商业支持。

   添加 RGW 例程

  要使用 Ceph 的 Ceph 对象网关组件,必须部署 RGW 例程。用下列方法创建新 RGW 例程:

ceph-deploy rgw create {gateway-node}

   例如

ceph-deploy rgw create node1

   对应客户端运行ceph-radosgw@rgw.node1

  RGW 例程默认会监听 7480 端口,可以更改该节点 ceph.conf 内与 RGW 相关的配置,如下:

[client]
rgw frontends = civetweb port=80

  添加 MONITORS

  Ceph 存储集群需要至少一个 Monitor 才能运行。为达到高可用,典型的 Ceph 存储集群会运行多个 Monitors,这样在单个 Monitor 失败时不会影响 Ceph 存储集群的可用性。Ceph 使用 PASOX 算法,此算法要求有多半 monitors(即 1 、 2:3 、 3:4 、 3:5 、 4:6 等 )形成法定人数。

  新增两个监视器到 Ceph 集群。

ceph-deploy mon add {ceph-node}

   例如:原有一个mon现在增加两个mon

ceph-deploy mon add node2
ceph-deploy mon add node3

   注意:需要在ceph.conf有[global]下有配置

public network = 192.168.1.0/24

   并且同步配置

ceph-deploy --overwrite-conf  admin admin-node node1 node2 node3

   新增 Monitor 后,Ceph 会自动开始同步并形成法定人数。你可以用下面的命令检查法定人数状态:

Tip 当你的 Ceph 集群运行着多个 monitor 时,各 monitor 主机上都应该配置 NTP ,而且要确保这些 monitor 位于 NTP 服务的同一级。

   查看

[root@admin-node my-cluster]# ceph -s
  cluster:
    id:     8dc0f409-70c1-4499-94a9-466abdf4f30d
    health: HEALTH_WARN
            no active mgr
 
  services:
    mon: 3 daemons, quorum node1,node2,node3 (age 3m) #3个mon
    mgr: no daemons active
    mds:  1 up:standby
    osd: 3 osds: 3 up (since 41m), 3 in (since 41m)
 
  data:
    pools:   0 pools, 0 pgs
    objects: 0 objects, 0 B
    usage:   0 B used, 0 B / 0 B avail
    pgs: