什么是复制集?

复制集是额外的数据副本,是跨多个服务器同步数据的过程,复制集提供了冗余并增加了数据可用性,通过复制集可以对硬件故障和中断的服务进行恢复。 复制集的优势如下:

  • 让数据更安全
  • 高数据可用性(24*7)
  • 灾难恢复
  • 无停机维护(如备份、索引重建、故障转移)
  • 读缩放(额外的副本读取)
  • 副本集对应用程序是透明的

复制集工作原理

MongoDB的复制集至少需要两个节点。其中一个是主节点(Primary),负责处理客户端的请求,其余的都是从节点(Secondary),负责复制主节点上的数据。 MongoDB各个节点常见的搭配方式为:一主一从或一主多从。主节点记录其上的所有操作到oplog中,从节点定期轮询主节点获取这些操作,从而保证从节点的数据与主节点一致。 客户端在主节点写入数据,在从节点读取数据,主节点与从节点进行数据交互保障数据的一致性。如果其中一个节点出现故障,其他节点马上会将业务接过来而无须停机操作。 复制集特点如下:

  • N个节点的群集
  • 任何节点可作为主节点
  • 所有写入操作都在主节点上
  • 自动故障转移
  • 自动恢复

MongoDB复制集部署

创建多实例

如何创建多实例,在我之前的博客中已经写过,可以参考Yum安装MongoDB及数据库管理每个实例创建时都应该先创建数据文件目录(mongo)和日志文件(mongod.log),同时在修改配置文件时要注意修改使用不同的端口号在做复制集时,我们要多修改一个参数,replication的参数值,并保证多个实例的该参数值都保持一致根据项目要求,需创建额外三个实例,加上原有的一个实例,一共四个实例。 我在做实验的时候发现,MongoDB中对配置文件的格式也有严格要求,在对replication参数值进行修改时要特别注意

replication:
  replSetName: chenrs      //该行内容需在行首空出两个空格,不空格或者多空格都会导致服务启动失败

项目示意图如下:

初始化配置复制集

创建复制集

我们先配置包含三个节点的复制集,多出来的一个节点,会在接下来再做一个节点添加的操作

mongo
chen={"_id":"chenrs","members":[{"_id":0,"host":"172.16.10.27:27017"},{"_id":1,"host":"172.16.10.27:27018"},{"_id":2,"host":"172.16.10.27:27019"}]}

初始化复制集

在初始化复制集时,要确保从节点没有数据,不然在初始化以后会造成从节点服务器的数据丢失。

rs.initiate(chen)

查看复制集中各节点状态

chenrs:SECONDARY> rs.status()
{
	"set" : "chenrs",
	"date" : ISODate("2018-07-14T14:40:20.756Z"),
         ···     //省略部分内容
	"members" : [
		{
			"_id" : 0,
			"name" : "172.16.10.27:27017",
			"health" : 1,             //健康值为1,代表该节点处于运行良好状态
			"state" : 1,               //1代表主
			"stateStr" : "PRIMARY",   //处于peimary状态
		 ···     //省略部分内容
		},
		{
			"_id" : 1,
			"name" : "172.16.10.27:27018",
			"health" : 1,
			"state" : 2,              //2代表从
			"stateStr" : "SECONDARY", //处于secondary状态
		···     //省略部分内容
		},
		{
			"_id" : 2,
			"name" : "172.16.10.27:27019",
			"health" : 1,
			"state" : 2,
			"stateStr" : "SECONDARY",
		···     //省略部分内容
		}
}
chenrs:PRIMARY>            //此时节点状态已经发生转变

节点管理(在primary上做)

添加节点

rs.add("172.16.10.27:27020")

删除节点

rs.remove("172.16.10.27:27020")

故障转移切换

模拟主节点损坏

ps aux | grep  mongod     //查询本地的节点的进程号
kill -9 40882             //杀死主节点进程

查看节点状态

chenrs:SECONDARY> rs.status()
{
	"set" : "chenrs",
	"date" : ISODate("2018-07-14T15:21:21.426Z"),
	"myState" : 2,
	"term" : NumberLong(2),
	"syncingTo" : "172.16.10.27:27019",
	"syncSourceHost" : "172.16.10.27:27019",
	"syncSourceId" : 2,
           ···   //省略部分内容
	"members" : [
		{
			"_id" : 0,
			"name" : "172.16.10.27:27017",
			"health" : 0,             //健康值为0,处于停机状态
			"state" : 8,
			"stateStr" : "(not reachable/healthy)",
           ···   //省略部分内容
		},
		{
			"_id" : 1,
			"name" : "172.16.10.27:27018",
			"health" : 1,
			"state" : 2,
			"stateStr" : "SECONDARY",
            ···   //省略部分内容
		},
		{
			"_id" : 2,
			"name" : "172.16.10.27:27019",
			"health" : 1,
			"state" : 1,
			"stateStr" : "PRIMARY",
            ···    //省略部分内容
        }
}

主动切换主从状态(在primary上做)

rs.freeze(30)      //暂停30s不参与选举
rs.stepDown(60,30)   //交出主节点位置,维持从节点状态不少于60秒,等待30秒使主节点和从节点日志同步

MongoDB复制选举原理及复制集管理