MongoDB在单节点中也可以做复制集,但是仅限于测试实验,最大的好处就是部署方便快速,可以随便添加新节点,节省资源。在这里我使用的是MongoDB 3.2版本进行复制集实验(但MongoDB配置文件使用的是老版本格式),一共使用三个节点,一个是主节点(PRIMARY),一个是从节点(SECONDARY),一个是投票节点(ARBITER)。如下图:

MongoDB 3.2复制集单节点部署(四)_配置文档

一、实验环境

1)节点信息:192.168.60.10

3)节点确保iptables和selinux已关闭

 
1
2
[root@node1 ~]# iptables -F
[root@node1 ~]# setenforce 0

二、安装MongoDB 3.2

 
1
2
3
4
5
mongodb-org-3.2.0-1.el6.x86_64.rpm
mongodb-org-mongos-3.2.0-1.el6.x86_64.rpm
mongodb-org-server-3.2.0-1.el6.x86_64.rpm
mongodb-org-shell-3.2.0-1.el6.x86_64.rpm
mongodb-org-tools-3.2.0-1.el6.x86_64.rpm

PS:需要的软件包可以去https://repo.mongodb.org/yum/redhat/下载,MongoDB的安装很简单,怎么安装都成。

三、配置单点复制集(启动三个套接字)

1)创建所需要的目录

 
1
2
3
4
5
6
$ mkdir -p /data/mongodb/{conf,log,pid,data}
$ mkdir -p /data/mongodb/conf/{conf27017,conf27018,conf27019}
$ mkdir -p /data/mongodb/log/{log27017,log27018,log27019}
$ mkdir -p /data/mongodb/pid/{pid27017,pid27018,pid27019}
$ mkdir -p /data/mongodb/data/{data27017,data27018,data27019}
$ chown -R mongod.mongod /data/mongodb/data/{data27017,data27018,data27019}

2)创建三个配置文件

192.168.60.10:27017

 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
$ cat /data/mongodb/conf/conf27017/mongod.conf
# 开启日志文件;
logpath = /data/mongodb/log/log27017/mongod.log
 
# 开启日志追加;
logappend = true
 
# 指定数据目录;
dbpath = /data/mongodb/data/data27017
 
# 实例端口;
port = 27017
 
# 绑定地址;
bind_ip = 0.0.0.0
 
# 守护进程模式开启;
fork = true
 
# 进程号文件;
pidfilepath = /data/mongodb/pid/pid27017/mongod.pid
 
# 日志回转;
logRotate = rename
 
# 日志时间格式;
timeStampFormat = ctime
 
# 日志刷盘间隔(默认100毫秒);
journalCommitInterval = 100
 
# 数据刷盘间隔(默认60秒);
syncdelay = 60
 
# 最大连接数(默认65536);
maxConns = 65536
 
 
###Replica Set
# Oplog大小(单位MB);
oplogSize = 1024
 
# 复制集名称;
replSet = ywnds

192.168.60.10:27018

 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
$ cat /data/mongodb/conf/conf27018/mongod.conf
logpath = /data/mongodb/log/log27018/mongod.log
logappend = true
dbpath = /data/mongodb/data/data27018
port = 27018
bind_ip = 0.0.0.0
fork = true
pidfilepath = /data/mongodb/pid/pid27018/mongod.pid
logRotate = rename
timeStampFormat = ctime
journalCommitInterval = 100
syncdelay = 60
maxConns = 65536
 
###Replica Set
oplogSize = 1024
replSet = ywnds

192.168.60.10:27019

 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
$ cat /data/mongodb/conf/conf27019/mongod.conf
logpath = /data/mongodb/log/log27019/mongod.log
logappend = true
dbpath = /data/mongodb/data/data27019
port = 27019
bind_ip = 0.0.0.0
fork = true
pidfilepath = /data/mongodb/pid/pid27019/mongod.pid
logRotate = rename
timeStampFormat = ctime
journalCommitInterval = 100
syncdelay = 60
maxConns = 65536
 
###Replica Set
oplogSize = 1024
replSet = ywnds

PS:更多具体参数详细含义请看《MongoDB命令行选项介绍》

3)启动集群(所有节点)

 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
$ killall mongod
 
$ mongod -f /data/mongodb/conf/conf27019/mongod.conf
about to fork child process, waiting until server is ready for connections.
forked process: 35554
child process started successfully, parent exiting
 
$ mongod -f /data/mongodb/conf/conf27018/mongod.conf
about to fork child process, waiting until server is ready for connections.
forked process: 35601
child process started successfully, parent exiting
 
$ mongod -f /data/mongodb/conf/conf27017/mongod.conf
about to fork child process, waiting until server is ready for connections.
forked process: 35648
child process started successfully, parent exiting

查看进程三个节点都启动

 
1
2
3
4
$ netstat -anplt | grep mongod
tcp        0      0 0.0.0.0:27019         0.0.0.0:*                   LISTEN      35554/mongod       
tcp        0      0 0.0.0.0:27017         0.0.0.0:*                   LISTEN      35648/mongod       
tcp        0      0 0.0.0.0:27018         0.0.0.0:*                   LISTEN      35601/mongod

4)选择一个节点做主节点(可以随意选择一个,这里我使用21017)

 
1
2
3
4
$ mongo 192.168.60.10:27017/admin
MongoDB shell version: 3.2.0
connecting to: 192.168.60.10:27017/admin
>

5)初始化27017节点

5.1.为复制集初始化建立配置文档

 
1
2
3
4
5
6
7
> config = {
_id:"ywnds",
members:[
{_id:0,host:"192.168.60.10:27017"},
{_id:1,host:"192.168.60.10:27018"},
{_id:2,host:"192.168.60.10:27019"}
]}

5.2.更新配置文档参数,设置27019为arbiterOnly(投票节点)

 
1
> config.members[2] = {"_id":2,"host":"192.168.60.10:27019","arbiterOnly":true}

PS:上面是把复制集初始化配置文档赋值给config变量,这里是通过membes数组的索引来修改节点属性,数组索引从0开始。

具体的配置文档说明请看《MongoDB复制集配置文档介绍》

5.3.使用rs.initiate(cfg)初始化集群

 
1
2
3
4
5
> rs.initiate(config)
{
         "info" : "Config now saved locally.  Should come online in about a minute.",
         "ok" : 1
}

这里使用rs.initiate(config)初始化集群,config文件为我们上面定义的。这里的ok返回值为1表示命令执行成功,如果为0则表示没有执行成功。跟Linux中的状态值刚好相反。现在可以使用rs.conf()方法返回配置文件内容。

 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
ywnds:PRIMARY> rs.conf()
{
         "_id" : "ywnds",
         "version" : 2,
         "protocolVersion" : NumberLong(1),
         "members" : [
                   {
                            "_id" : 0,
                            "host" : "192.168.60.10:27017",
                            "arbiterOnly" : false,
                            "buildIndexes" : true,
                            "hidden" : false,
                            "priority" : 1,
                            "tags" : {
 
                            },
                            "slaveDelay" : NumberLong(0),
                            "votes" : 1
                   },
                   {
                            "_id" : 1,
                            "host" : "192.168.60.10:27018",
                            "arbiterOnly" : false,
                            "buildIndexes" : true,
                            "hidden" : false,
                            "priority" : 1,
                            "tags" : {
 
                            },
                            "slaveDelay" : NumberLong(0),
                            "votes" : 1
                   },
                   {
                            "_id" : 2,
                            "host" : "192.168.60.10:27019",
                            "arbiterOnly" : true,
                            "buildIndexes" : true,
                            "hidden" : false,
                            "priority" : 1,
                            "tags" : {
 
                            },
                            "slaveDelay" : NumberLong(0),
                            "votes" : 1
                   }
         ],
         "settings" : {
                   "chainingAllowed" : true,
                   "heartbeatIntervalMillis" : 2000,
                   "heartbeatTimeoutSecs" : 10,
                   "electionTimeoutMillis" : 10000,
                   "getLastErrorModes" : {
 
                   },
                   "getLastErrorDefaults" : {
                            "w" : 1,
                            "wtimeout" : 0
                   }
         }
}

在Mongodb3.2版本中,相比之前的版本rs.conf返回配置文件的信息更加详细了。把”arbiterOnly”、”buildIndexes”、”hidden”、”priority”、”tags”、”slaveDelay”、”votes”的默认值都给真是出来了,具体的含义看《MongoDB复制集配置文档介绍》。

5.4.查看集群状态

 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
ywnds:PRIMARY> rs.status()
{
"set" : "ywnds",
"date" : ISODate("2016-02-03T01:56:49Z"),
"myState" : 1,
"members" : [
{
"_id" : 0,
"name" : "192.168.60.10:27017",
"health" : 1,
"state" : 1,
"stateStr" : "PRIMARY",
"uptime" : 1043,
"optime" : Timestamp(1454464583, 1),
"optimeDate" : ISODate("2016-02-03T01:56:23Z"),
"electionTime" : Timestamp(1454464592, 1),
"electionDate" : ISODate("2016-02-03T01:56:32Z"),
"self" : true
},
{
"_id" : 1,
"name" : "192.168.60.10:27018",
"health" : 1,
"state" : 2,
"stateStr" : "SECONDARY",
"uptime" : 25,
"optime" : Timestamp(1454464583, 1),
"optimeDate" : ISODate("2016-02-03T01:56:23Z"),
"lastHeartbeat" : ISODate("2016-02-03T01:56:48Z"),
"lastHeartbeatRecv" : ISODate("2016-02-03T01:56:47Z"),
"pingMs" : 2,
"syncingTo" : "192.168.60.10:27017"
},
{
"_id" : 2,
"name" : "192.168.60.10:27019",
"health" : 1,
"state" : 7,
"stateStr" : "ARBITER",
"uptime" : 25,
"lastHeartbeat" : ISODate("2016-02-03T01:56:48Z"),
"lastHeartbeatRecv" : ISODate("2016-02-03T01:56:47Z"),
"pingMs" : 0
}
],
"ok" : 1
}

我们的集群中有三个节点,由状态返回值可以看出27017为PRIMARY节点,而27018为SECONDARY节点,而27019为我们设置的ARBITER节点。这里我们发现mongodb的角标已经变了,变成了复制集名称加上当前节点的状态。同样如果登陆27018和27019会发现都发生了变化。

5.5.查看主节点local库

 
1
2
3
4
5
6
7
8
9
10
ywnds:PRIMARY> use local
switched to db local
ywnds:PRIMARY> show tables
me
oplog.rs
replset.minvalid
slaves
startup_log
system.indexes
system.replset

这里我们看一下本地的local库,每一个mongod实例都有自己的local数据库,其中存储了复制进程所用的数据和其他实例单独的信息,local数据库对于复制时不可见的,local数据库将不会被复制。

进入到local库可以看到一些集合和索引文件,其中startup_log 是一个固定集合,该集合主要是用来诊断的(每个mongod 实例向 startup_log 插入一条有关mongod实例自身和host信息的诊断信息);system.replset保存了复制集的配置文档信息(就是我们上面定义的config),跟rs.conf()返回的信息一样;oplog.rs是一个存储了oplog的固定集合,大小为我们在配置文件中设置的大小;replset.minvalid包含了复制集内部定位复制集状态信息;slaves包含了复制集每个节点和与其通讯的最后时间戳。如果该集合过时了,我们可以通过删除该节点来让复制集自动刷新生成。

6)验证复制集

192.168.60.10:27017插入数据

 
1
2
3
4
5
6
7
$ mongo 192.168.60.10:27017
MongoDB shell version: 3.2.0
connecting to: 192.168.60.10:27017/test
ywnds:PRIMARY> use ywnds
switched to db ywnds
ywnds:PRIMARY> db.ywnds.insert({name:"ywnds",age:"20",gender:"B"})
WriteResult({ "nInserted" : 1 })

然后我们来看一下主节点的数据目录(WiredTiger存储引擎为例)

 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
$ ll -h /data/mongodb/data/data27017/
总用量 400K
-rw-r--r--. 1 root root  16K 1月  18 03:29 collection-0--3354265032980496329.wt
-rw-r--r--. 1 root root  16K 1月  18 03:29 collection-2--3354265032980496329.wt
-rw-r--r--. 1 root root  36K 1月  18 04:26 collection-4--3354265032980496329.wt
-rw-r--r--. 1 root root  32K 1月  18 03:39 collection-5--3354265032980496329.wt
-rw-r--r--. 1 root root  16K 1月  18 03:32 collection-7--3354265032980496329.wt
-rw-r--r--. 1 root root  16K 1月  18 04:26 collection-9--3354265032980496329.wt
drwxr-xr-x. 2 root root 4.0K 1月  18 04:33 diagnostic.data
-rw-r--r--. 1 root root  16K 1月  18 04:26 index-10--3354265032980496329.wt
-rw-r--r--. 1 root root  16K 1月  18 03:29 index-1--3354265032980496329.wt
-rw-r--r--. 1 root root  16K 1月  18 03:29 index-3--3354265032980496329.wt
-rw-r--r--. 1 root root  16K 1月  18 03:32 index-6--3354265032980496329.wt
-rw-r--r--. 1 root root  16K 1月  18 03:32 index-8--3354265032980496329.wt
drwxr-xr-x. 2 root root 4.0K 1月  18 03:28 journal
-rw-r--r--. 1 root root  36K 1月  18 04:26 _mdb_catalog.wt
-rw-r--r--. 1 root root    6 1月  18 03:28 mongod.lock
-rw-r--r--. 1 root root  36K 1月  18 04:26 sizeStorer.wt
-rw-r--r--. 1 root root   95 1月  18 03:28 storage.bson
-rw-r--r--. 1 root root   49 1月  18 03:28 WiredTiger
-rw-r--r--. 1 root root 4.0K 1月  18 03:28 WiredTigerLAS.wt
-rw-r--r--. 1 root root   21 1月  18 03:28 WiredTiger.lock
-rw-r--r--. 1 root root  920 1月  18 04:26 WiredTiger.turtle
-rw-r--r--. 1 root root  64K 1月  18 04:26 WiredTiger.wt

这里我们可以看到,由于使用了WiredTiger存储引擎,数据存储格式都跟MongoDB 2.6(使用MMAPV1存储引擎)不同了。

192.168.60.10:27018同步数据

 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
$ mongo 192.168.60.10:27018
MongoDB shell version: 3.2.0
connecting to: 192.168.60.10:27018/test
ywnds:SECONDARY> rs.slaveOk()
ywnds:SECONDARY> show dbs
local  0.000GB
ywnds  0.000GB
ywnds:SECONDARY> use ywnds
switched to db ywnds
ywnds:SECONDARY> show tables
2016-02-03T11:34:24.505+0800 error: { "$err" : "not master and slaveOk=false", "code" : 13435 }
ywnds:SECONDARY> db.ywnds.insert({name:"eric",age:20})
WriteResult({ "writeError" : { "code" : undefined, "errmsg" : "not master" } })
ywnds:SECONDARY> rs.slaveOk(true)
ywnds:SECONDARY> show tables
ywnds
ywnds:SECONDARY> db.ywnds.find()
{ "_id" : ObjectId("569bf8b9a0c81df2ebc0d75d"), "name" : "ywnds", "age" : 20, "gender" : "B" }

我们看到数据已经同步过来了,但是如果我们不是通过驱动连接从节点的话,我们查看数据时会报错,说我们不是master节点,且slaveOK=false,所以查看不了。MongoDB在数据一致性上确实下了很大的功夫啊。那么也就是说如果从节点想查看数据就需要开启slaveOK,并且在从节点上是无法进行写入操作的。然后我们开启rs.slaveOk(1)立马就可以查看同步的数据了。

192.168.60.10:27019投票节点

 
1
2
3
4
5
6
7
8
9
10
11
12
13
$ mongo 192.168.60.10:27019
MongoDB shell version: 3.2.0
connecting to: 192.168.60.10:27019/test
ywnds:ARBITER> show dbs
admin  (empty)
local  0.078GB
ywnds:ARBITER> use local
switched to db local
ywnds:ARBITER> show tables
me
startup_log
system.indexes
system.replset

连接到投票节点,我们可以看到PRIMARY上的数据没有同步到投票节点上来,没有ywnds这个库。但是这里需要说明的是,我们可以看到arbiter虽然不同步数据但是local库却有system.indexes和system.replset这两个文件。另外我们可以发现local数据的大小为0.078GB(80M),库物理文件的第一个文件默认大小为64M,而命名空间文件为16M。

四、按照功能来区分复制集成员

从上面的分析可以看出三个节点的不同之处,也可以这么说,上面我们是按照数据来区分不同的复制集节点,那么下面我们按照功能上来区分各个节点。先来简单说一下各个节点状态的不同所能提供的功能有哪些?

主节点(PRIMARY):默认提供读写服务的节点。

从节点(SECONDARY):提供读服务的节点,但可以提供多样性服务,如可以转为“隐藏节点”对程序不可见、转为“延时节点”延时复制节点、转为“投票节点”具有投票权但不是arbiter。

投票节点(ARBITER):ARBITER节点,无数据,仅作选举和充当复制集节点、也称它为选举节点。

五、复制集自动容灾

Mongodb复制集最大的特点就是可以自动容灾,这个特性是从主从复制的架构上改变而来,简单来说就是当复制集(3节点)中如果PRIMARY发生故障,其他节点无法探测到它的心跳信息时,复制集就会产生从新投票选出一个新的PRIAMRY提供服务。下面我们来模拟一下MongoDB的自动故障转移功能。

我们连接到27017主机上,此时的27017是PRIMARY

 
1
2
3
4
$ mongo 192.168.60.10:27017
MongoDB shell version: 3.2.0
connecting to: 192.168.60.10:27017/test
ywnds:PRIMARY>

我们连接到27018主机上,此时的27018是SECONDARY

 
1
2
3
4
$ mongo 192.168.60.10:27018
MongoDB shell version: 3.2.0
connecting to: 192.168.60.10:27018/test
ywnds:SECONDARY>

我们连接到27019主机上,此时的27019是ARBITER

 
1
2
3
4
$ mongo 192.168.60.10:27019
MongoDB shell version: 3.2.0
connecting to: 192.168.60.10:27019/test
ywnds:ARBITER>

模拟主节点宕机,kill掉27017的进程。

 
1
2
3
4
5
6
$ cat /mongodb/pid/pid27017/mongod.pid
125484
$ kill -2 125484
$ ps aux | grep mongod
root     125581  0.5  7.9 5266620 48252 ?       Sl   04:07   0:00 mongod -f /data/mongodb/conf/conf27018/mongod.conf
root     125670  0.5  5.1 849056 31440 ?        Sl   04:07   0:00 mongod -f /data/mongodb/conf/conf27019/mongod.conf

然后登录27018主机上,看看此时的SECONDARY已经转为PRIMARY了,但是这个过程会有短暂的断开。

 
1
2
3
4
$ mongo 192.168.60.10:27018
MongoDB shell version: 3.2.0
connecting to: 192.168.60.10:27018/test
ywnds:PRIMARY>

而27019主机上ARBITER还是ARBITER节点。

 
1
2
3
4
$ mongo 192.168.60.10:27019
MongoDB shell version: 3.2.0
connecting to: 192.168.60.10:27019/test
ywnds:ARBITER>

有兴趣可以通过show log rs命令查看复制集的日志信息,看看这个过程是怎么进行的。这就是MongoDB三节点(一主一从一投票或一主二从)复制集的故障转移功能,是不是很强大。当然除了复制集内部自动选举之外,我们也可以进行人工干预,使用rs.stepdown()方法可以手动切换。