calamari + ceph + saltstack 安装部署

原创

wuye1232588 2017-09-08 18:06:46 博主文章分类：Linux 服务 ©著作权

文章标签 ceph saltstack calamari 文章分类 运维

©著作权归作者所有：来自51CTO博客作者wuye1232588的原创作品，请联系作者获取转载授权，否则将追究法律责任

准备工作

1、基础环境

ceph-admin ceph-mon  为同一台服务器
ceph-osd1 为一台服务器
ceph-osd2 为另一台服务器

2、关闭防火墙

# systemctl stop firewalld.service
# systemctl disable firewalld.service

3、关闭Selinux

# sed -i 's/SELINUX=enforcing/SELINUX=disabled/' /etc/selinux/config
# setenforce 0

重启服务器

4、配置 Yum源

# yum install wget vim curl -y
# yum clean all
# mkdir /etc/yum.repos/repo
# cd /etc/yum.repos/
# mv *.repo repo/
下载阿里云的Base源
# wget -O /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-7.repo
下载阿里云的epel源
# wget -O /etc/yum.repos.d/epel.repo http://mirrors.aliyun.com/repo/epel-7.repo
# sed -i '/aliyuncs/d' /etc/yum.repos.d/CentOS-Base.repo
# sed -i '/aliyuncs/d' /etc/yum.repos.d/epel.repo

添加ceph源

# vim /etc/yum.repos.d/ceph.repo

[ceph]
name=ceph
baseurl=http://mirrors.aliyun.com/ceph/rpm-jewel/el7/x86_64/
gpgcheck=0
priority=1

[ceph-noarch]
name=cephnoarch
baseurl=http://mirrors.aliyun.com/ceph/rpm-jewel/el7/noarch/
gpgcheck=0
priority=1

[ceph-source]
name=Ceph source packages
baseurl=http://mirrors.aliyun.com/ceph/rpm-jewel/el7/SRPMS
enabled=1
gpgcheck=1
type=rpm-md
gpgkey=https://mirrors.aliyun.com/ceph/keys/release.asc
priority=1

缓存yum 元数据

# yum makecache

5、同步时间

将所有节点的时间进行校对

# yum install ntp ntpdate

配置方式比较简单，略过...

6、将各个节点的主机名添加到各个节点的Hosts文件中

# cat /etc/hosts

192.168.203.100 ceph-admin
192.168.203.150 ceph-osd1
192.168.203.200 ceph-osd2

7、配置Ssh 免密码登陆

# ssh-keygen -t rsa

一路回车，直到完成

将密码拷贝到其他各个服务器

# ssh-copy-id ceph-admin
# ssh-copy-id ceph-osd1
# ssh-copy-id ceph-osd2

安装Ceph

安装软件(在Ceph Admin节点上,以Root用户安装)

# mkdir ceph-cluster
# cd ceph-cluster
# yum install ceph ceph-deploy

注：如果在安装过程中遇到问题，需要重新开始安装，执行以下命令来清空配置(新安装的不需要操作)

下面的命令会将安装的包卸载掉
# ceph-deploy purge ceph-admin ceph-osd1 ceph-osd2

下面的命令会清除数据
# ceph-deploy purgedata ceph-admin ceph-osd1 ceph-osd2

下面的命令清除key
# ceph-deploy forgetkeys

使用Ceph-Deploy 为所有节点安装Ceph

# ceph-deploy install ceph-admin ceph-osd1 ceph-osd2

创建监控节点

# ceph-deploy new ceph-admin

命令执行之后会在当前目录生成ceph.conf文件，打开文件增加一行内容（表示有两个osd）

osd pool default size = 2

# ceph-deploy --overwrite-conf mon create ceph-admin

注：如果监控节点比较多，请注意查看显示的信息是否正确

初始化监控节点

# ceph-deploy mon create-initial

查看当前监控器的状态(在监控机器上执行)

# ceph daemon mon.`hostname` mon_status
{
    "name": "adm",
    "rank": 0,
    "state": "leader",
    "election_epoch": 3,
    "quorum": [
        0
    ],
    "outside_quorum": [],
    "extra_probe_peers": [],
    "sync_provider": [],
    "monmap": {
        "epoch": 1,
        "fsid": "7fe7736b-3ea6-4c8a-b3bd-81f9355a51c6",
        "modified": "2017-08-27 15:25:30.486560",
        "created": "2017-08-27 15:25:30.486560",
        "mons": [
            {
                "rank": 0,
                "name": "adm",
                "addr": "192.168.203.153:6789\/0"
            }
        ]
    }
}

部署OSD

为存储节点osd分配磁盘空间(在osd1和osd2 分别创建文件夹，并给予权限)

# mkdir /data
# chwon ceph.ceph -R /data

通过ceph-admin 节点的ceph-deploy 开启osd进程，并激活

# ceph-deploy gatherkeys ceph-admin ceph-mon1 ceph-mon2 ceph-mon3 ceph-osd1 ceph-osd2

# ceph-deploy  --overwrite-conf  osd prepare ceph-osd1:/data ceph-osd2:/data

# ceph-deploy osd activate ceph-osd1:/data ceph-osd2:/data

把ceph-admin节点的配置文件与keying同步至其他节点

# ceph-deploy admin ceph-admin ceph-osd1 ceph-osd2
# chmod +r /etc/ceph/ceph.client.admin.keyring

如果以上步骤没有报错误，那么基本上ceph就安装完了。

查看集群健康命令

# ceph -s
    cluster 7fe7736b-3ea6-4c8a-b3bd-81f9355a51c6
     health HEALTH_OK
     monmap e1: 1 mons at {adm=192.168.203.153:6789/0}
            election epoch 3, quorum 0 adm
     osdmap e27: 2 osds: 2 up, 2 in
            flags sortbitwise,require_jewel_osds
      pgmap v4466: 120 pgs, 8 pools, 105 MB data, 173 objects
            13743 MB used, 22012 MB / 35756 MB avail
                 120 active+clean

# ceph health
HEALTH_OK

Mon和Osd的启动方式

mon-1为各个monitor所在节点的主机名。

# systemctl start ceph-mon@mon-1.service 
# systemctl restart ceph-mon@mon-1.service
# systemctl stop ceph-mon@mon-1.service

0为该节点的OSD的id，可以通过`ceph osd tree`查看

# systemctl start/stop/restart ceph-osd@0.service

处理Osd Down的情况

查看osd 信息
# ceph osd tree
ID WEIGHT  TYPE NAME          UP/DOWN REWEIGHT PRIMARY-AFFINITY 
-1 0.03400 root default                                         
-2 0.01700     host ceph-osd1                                   
 4 0.01700         osd.4           up  1.00000          1.00000 
-3 0.01700     host ceph-osd2                                   
 3 0.01700         osd.3           up  1.00000          1.00000 
 1       0 osd.1                 down        0          1.00000 
 2       0 osd.2                 down        0          1.00000 
将down的转台设置为out
# ceph osd out osd.1
osd.1 is already out. 
# ceph osd out osd.2
osd.2 is already out.
将osd从集群中删除 
# ceph osd rm osd.2
removed osd.2
# ceph osd rm osd.1
removed osd.1
# ceph osd tree
ID WEIGHT  TYPE NAME          UP/DOWN REWEIGHT PRIMARY-AFFINITY 
-1 0.03400 root default                                         
-2 0.01700     host ceph-osd1                                   
 4 0.01700         osd.4           up  1.00000          1.00000 
-3 0.01700     host ceph-osd2                                   
 3 0.01700         osd.3           up  1.00000          1.00000 

从CRUSH 中删除
关于CRUSH介绍 
(http://www.cnblogs.com/chenxianpao/p/5568207.html)
# ceph osd crush rm osd.3
删除osd.3的认证信息
# ceph auth del osd.3

部署Rgw网关

如果使用ceph 的对象存储，需要部署rgw网关。执行以下步骤创建一个新的rgw实例 (下面还是以ceph-admin为例)

# ceph-deploy rgw create ceph-admin

验证Ceph

写入数据并查看数据

创建一个普通文件，并向其写入数据创建一个pool。格式为 rados mkpool pool-name

# rados mkpool data

将文件写入pool。格式：rados put object-name filename --pool=pool-name

# rados put test-object-0 /tmp/aaa --pool=data

查看文件是否在pool中。格式为rados -p pool-name ls

# rados -p data ls

确定文件位置。格式为ceph osd map pool-name object-name

# ceph osd map data test-object-2
osdmap e27 pool 'data' (7) object 'test-object-2' -> pg 7.cbbef8c8 (7.0) -> up ([1,0], p1) acting ([1,0], p1)

从pool 中读取文件。格式为rados get object-name --pool=pool-name filename （filename是你要保存文件）

# rados get test-object-0 --pool=data /tmp/myfile

从pool中删除文件。格式为 rados rm object-name --pool=pool-name

# rados rm test-object-0 --pool=data

安装Calamari

安装Salt

在ceph-admin ceph-osd1 ceph-osd2 节点上安装

# yum localinstall salt-2015.8.1-1.el7.noarch.rpm
# rpm -ivh salt-minion-2015.8.1-1.el7.noarch.rpm

在ceph-admin 安装salt-master

# rpm -ivh salt-master-2015.8.1-1.el7.noarch.rpm

安装Calamari-Server

# yum localinstall calamari-server-1.3.3-jewel.el7.centos.x86_64.rpm
# yum install mod_wsgi -y

初始化 calamari

# calamari-ctl initialize

需要填写账户、Email、密码

修改calamari密码方式

格式 ：# calamari-ctl change_password --password {password} {user-name}
# calamari-ctl change_password --password 1234567 root

安装Diamond

# rpm -ivh diamond-3.4.68-jewel.noarch.rpm
# mv /etc/diamond/diamond.conf.example /etc/diamond/diamond.conf

可以修改数据的刷新频率。下面两个文件控制刷新频率修改文件 /etc/graphite/storage-schemas.conf（默认60s）

[calamari]
pattern = .*
retentions = 60s:1d,15m:7d

可以将 retentions = 60s:1d,15m:7d 修改为 retentions = 3


----------


----------


0s:1d,15m:7d

修改文件 /etc/diamond/diamond.conf

默认是注释
#interval = 300
修改为
interval = 120

如果在初始化前，可以修改模板，注意初始化会用模板文件覆盖 /opt/calamari/salt/salt/base/diamond.conf

修改diamond配置文件 /etc/diamond/diamond.conf

# Graphite server host
host = adm

这个host要填写你的calamari的管理平台服务器的主机名，这个地方是用diamond收集集群数据和硬件的数据发送到管理平台的机器的carbon进程，然后存储在whisper这个数据库当中的，所有的需要收集数据的机器都需要修改。修改完成后，重启diamond

# /etc/init.d/diamond restart

修改salt-minion配置文件 /etc/salt/minion

master：adm

下面命令在每一个节点都执行以下。最后一个是节点主机名

# ceph-deploy calamari connect ceph-admin ceph-osd1 ceph-osd2

# cat /etc/salt/minion.d/calamari.conf 
master: ceph-admin

重启服务

# systemctl restart  salt-minion.service

Salt-Master 认证认可

在salt-master上执行认证(也就是安装calamari-server的服务器上)查询当前的认证请求

# salt-key -L

批准认证请求

# salt-key -A

查询是否正常通过,随便测试一下

# salt-key -L
# salt '*' test.ping
# salt '*' ceph.get_heartbeats

配置calamari-server 文件权限

# cd /var/log/calamari
# chmod 777 -R *
# service supervisord restart

安装客户端 Romana

romana是集群的web管理界面，在calamari-server上安装

# rpm -ivh romana-1.2.2-36_gc62bb5b.el7.centos.x86_64.rpm

访问web管理平台，输入当前机器的IP地址接口，默认端口是80

测试结果

从部署流程到测试文件写入，监控界面来看以及使用感受来看，这个可以弃用，太TM烂了

上一篇：ELK + kafka + filebeat +kibana

下一篇：Centos7 docker push 推送失败

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯