什么是复制集?
复制集是额外的数据副本,是跨多个服务器同步数据的过程,复制集提供了冗余并增加了数据可用性,通过复制集可以对硬件故障和中断的服务进行恢复。 复制集的优势如下:
- 让数据更安全
- 高数据可用性(24*7)
- 灾难恢复
- 无停机维护(如备份、索引重建、故障转移)
- 读缩放(额外的副本读取)
- 副本集对应用程序是透明的
复制集工作原理
MongoDB的复制集至少需要两个节点。其中一个是主节点(Primary),负责处理客户端的请求,其余的都是从节点(Secondary),负责复制主节点上的数据。 MongoDB各个节点常见的搭配方式为:一主一从或一主多从。主节点记录其上的所有操作到oplog中,从节点定期轮询主节点获取这些操作,从而保证从节点的数据与主节点一致。 客户端在主节点写入数据,在从节点读取数据,主节点与从节点进行数据交互保障数据的一致性。如果其中一个节点出现故障,其他节点马上会将业务接过来而无须停机操作。 复制集特点如下:
- N个节点的群集
- 任何节点可作为主节点
- 所有写入操作都在主节点上
- 自动故障转移
- 自动恢复
MongoDB复制集部署
创建多实例
如何创建多实例,在我之前的博客中已经写过,可以参考Yum安装MongoDB及数据库管理每个实例创建时都应该先创建数据文件目录(mongo)和日志文件(mongod.log),同时在修改配置文件时要注意修改使用不同的端口号在做复制集时,我们要多修改一个参数,replication的参数值,并保证多个实例的该参数值都保持一致根据项目要求,需创建额外三个实例,加上原有的一个实例,一共四个实例。 我在做实验的时候发现,MongoDB中对配置文件的格式也有严格要求,在对replication参数值进行修改时要特别注意
replication:
replSetName: chenrs //该行内容需在行首空出两个空格,不空格或者多空格都会导致服务启动失败
项目示意图如下:
初始化配置复制集
创建复制集
我们先配置包含三个节点的复制集,多出来的一个节点,会在接下来再做一个节点添加的操作
mongo
chen={"_id":"chenrs","members":[{"_id":0,"host":"172.16.10.27:27017"},{"_id":1,"host":"172.16.10.27:27018"},{"_id":2,"host":"172.16.10.27:27019"}]}
初始化复制集
在初始化复制集时,要确保从节点没有数据,不然在初始化以后会造成从节点服务器的数据丢失。
rs.initiate(chen)
查看复制集中各节点状态
chenrs:SECONDARY> rs.status()
{
"set" : "chenrs",
"date" : ISODate("2018-07-14T14:40:20.756Z"),
··· //省略部分内容
"members" : [
{
"_id" : 0,
"name" : "172.16.10.27:27017",
"health" : 1, //健康值为1,代表该节点处于运行良好状态
"state" : 1, //1代表主
"stateStr" : "PRIMARY", //处于peimary状态
··· //省略部分内容
},
{
"_id" : 1,
"name" : "172.16.10.27:27018",
"health" : 1,
"state" : 2, //2代表从
"stateStr" : "SECONDARY", //处于secondary状态
··· //省略部分内容
},
{
"_id" : 2,
"name" : "172.16.10.27:27019",
"health" : 1,
"state" : 2,
"stateStr" : "SECONDARY",
··· //省略部分内容
}
}
chenrs:PRIMARY> //此时节点状态已经发生转变
节点管理(在primary上做)
添加节点
rs.add("172.16.10.27:27020")
删除节点
rs.remove("172.16.10.27:27020")
故障转移切换
模拟主节点损坏
ps aux | grep mongod //查询本地的节点的进程号
kill -9 40882 //杀死主节点进程
查看节点状态
chenrs:SECONDARY> rs.status()
{
"set" : "chenrs",
"date" : ISODate("2018-07-14T15:21:21.426Z"),
"myState" : 2,
"term" : NumberLong(2),
"syncingTo" : "172.16.10.27:27019",
"syncSourceHost" : "172.16.10.27:27019",
"syncSourceId" : 2,
··· //省略部分内容
"members" : [
{
"_id" : 0,
"name" : "172.16.10.27:27017",
"health" : 0, //健康值为0,处于停机状态
"state" : 8,
"stateStr" : "(not reachable/healthy)",
··· //省略部分内容
},
{
"_id" : 1,
"name" : "172.16.10.27:27018",
"health" : 1,
"state" : 2,
"stateStr" : "SECONDARY",
··· //省略部分内容
},
{
"_id" : 2,
"name" : "172.16.10.27:27019",
"health" : 1,
"state" : 1,
"stateStr" : "PRIMARY",
··· //省略部分内容
}
}
主动切换主从状态(在primary上做)
rs.freeze(30) //暂停30s不参与选举
rs.stepDown(60,30) //交出主节点位置,维持从节点状态不少于60秒,等待30秒使主节点和从节点日志同步