1.先了解一下linux对内存的管理方式: 
在Linux里(别的系统也差不多),内存有物理内存和虚拟内存之说,物理内存是什么自然无需解释,虚拟内存实际是物理内存的抽象,多数情况下,出于方便性的考虑,程序访问的都是虚拟内存地址,然后操作系统会把它翻译成物理内存地址。 
很多人会把虚拟内存和Swap混为一谈,实际上Swap只是虚拟内存引申出的一种技术而已:操作系统一旦物理内存不足,为了腾出内存空间存放新内容,就会把当前物理内存中的内容放到交换分区里,稍后用到的时候再取回来,需要注意的是,Swap的使用可能会带来性能问题,偶尔为之无需紧张,糟糕的是物理内存和交换分区频繁的发生数据交换,这被称之为Swap颠簸,一旦发生这种情况,先要明确是什么原因造成的,如果是内存不足就好办了,加内存就可以解决,不过有的时候即使内存充足也可能会出现这种问题。解决方法是限制使用Swap: 

[root@mongodb ~]# sysctl -w vm.swappiness=0 

查看内存情况最常用的是free命令: 

[root@mongodb ~]# free -m
              total        used        free      shared  buff/cache   available
Mem:           7822        5093         129           0        2599        2443
Swap:             0           0           0

新手看到used一栏数值偏大,free一栏数值偏小,往往会认为内存要用光了。其实并非如此,之所以这样是因为每当我们操作文件的时候,Linux都会尽可能的把文件缓存到内存里,这样下次访问的时候,就可以直接从内存中取结果,所以cached一栏的数值非常的大,不过不用担心,这部分内存是可回收的,操作系统会按照LRU算法淘汰冷数据。除了cached,还有一个buffers,它和cached类似,也是可回收的,不过它的侧重点在于缓解不同设备的操作速度不一致造成的阻塞,这里就不多做解释了。 
知道了原理,我们就可以推算出系统可用的内存是free + buffers + cached,至于系统实际使用的内存是used – buffers – cached。

除了free命令,还可以使用sar命令:

[root@mongodb ~]# sar -r
Linux 3.10.0-514.6.2.el7.x86_64 (mongodb)       07/16/2021      _x86_64_        (4 CPU)

12:00:01 AM kbmemfree kbmemused  %memused kbbuffers  kbcached  kbcommit   %commit  kbactive   kbinact   kbdirty
12:10:01 AM    178424   7832016     97.77     12600    997560   7404844     92.44   7050672    527532       124
12:20:01 AM    132188   7878252     98.35     12628   1043284   7404820     92.44   7068096    556064        80
12:30:01 AM    152124   7858316     98.10     12544   1023568   7404788     92.44   7078700    525200        92
12:40:01 AM    168408   7842032     97.90     15228   1005108   7404800     92.44   7053724    534792       144
12:50:02 AM    150300   7860140     98.12     12688   1009264   7434844     92.81   7075148    530472       664
01:00:01 AM    129680   7880760     98.38     10624   1033012   7422296     92.66   7084864    541296       372
01:10:01 AM    135820   7874620     98.30      6452   1054888   7422292     92.66   7088364    537704     17972
01:20:01 AM    146848   7863592     98.17      8180   1063844   7422324     92.66   7077476    539528     34080
01:30:01 AM    130196   7880244     98.37      8616   1089936   7419544     92.62   7074288    558760     31048

[root@mongodb ~]# sar -W
Linux 3.10.0-514.6.2.el7.x86_64 (mongodb) 07/16/2021 _x86_64_ (4 CPU)

12:00:01 AM pswpin/s pswpout/s
12:10:01 AM 0.00 0.00
12:20:01 AM 0.00 0.00
12:30:01 AM 0.00 0.00
12:40:01 AM 0.00 0.00
12:50:02 AM 0.00 0.00
01:00:01 AM 0.00 0.00

 

2.看一个MongoDB服务器的top命令结果:

[root@mongodb ~]# top -p $(pidof mongod)

top - 10:25:25 up 1074 days, 21:31,  2 users,  load average: 0.77, 0.63, 0.58
Tasks:   1 total,   0 running,   1 sleeping,   0 stopped,   0 zombie
%Cpu(s):  6.8 us,  1.1 sy,  0.0 ni, 91.6 id,  0.5 wa,  0.0 hi,  0.1 si,  0.0 st
KiB Mem :  8010440 total,   848492 free,  5102988 used,  2058960 buff/cache
KiB Swap:        0 total,        0 free,        0 used.  2621556 avail Mem 

  PID USER      PR  NI    VIRT    RES    SHR S  %CPU %MEM     TIME+ COMMAND                                                         
 8416 root      20   0 3543440 2.385g   9864 S  29.3 31.2   6:52.62 mongod

或者 先top后,然后 shift+m 把当前进场按占用内存的多少排序。看看你的mongodb能占用多少内存。 

平时可以通过mongo命令行来监控MongoDB的内存使用情况,如下所示:

MongoDB Enterprise > db.serverStatus().mem;
{
        "bits" : 64,
        "resident" : 2588,
        "virtual" : 3612,
        "supported" : true,
        "mapped" : 0,
        "mappedWithJournal" : 0
}

还可以通过mongostat命令来监控MongoDB的内存使用情况,如下所示:

[root@mongodb ~]# mongostat  --authenticationDatabase=admin
insert query update delete getmore command dirty  used flushes vsize   res qrw arw net_in net_out conn                time
  1636    *0     *0     *0       0     4|0  8.0% 80.1%       0 3.53G 2.53G 0|0 1|0   452k    105k   13 Jul 16 10:42:39.357
  1620    *0     *0     *0       0     3|0  8.0% 80.1%       0 3.53G 2.53G 0|0 1|0   450k    103k   13 Jul 16 10:42:40.358
  1671    *0     *0     *0       0     1|0  7.9% 80.0%       0 3.53G 2.53G 0|0 1|0   460k    103k   13 Jul 16 10:42:41.358
  1630    *0     *0     *0       0     2|0  8.1% 80.0%       0 3.53G 2.53G 0|0 1|0   450k    103k   13 Jul 16 10:42:42.356
  1626    *0     *0     *0       0     1|0  7.9% 79.9%       0 3.53G 2.53G 0|0 1|0   451k    103k   13 Jul 16 10:42:43.356

其中内存相关字段的含义是: 
mapped:映射到内存的数据大小 
visze:占用的虚拟内存大小 
res:实际使用的内存大小 
注:如果操作不能再内存中完成,结果faults列的数值不会是0,视大小可能有性能问题。

vsize是mapped的两倍,而mapped等于数据文件的大小,所以说vsize是数据文件的两倍,之所以会这样,是因为本例中,MongoDB开启了journal,需要在内存里多映射一次数据文件,如果关闭journal,则vsize和mapped大致相当。 

如果想验证这一点,可以在开启或关闭journal后,通过pmap命令来观察文件映射情况: 

[root@mongodb ~]# pmap $(pidof mongod) 
8416:   /usr/local/mongodb/bin/mongod --config=/usr/local/mongodb/mongodb.conf
00001190f3743000 655360K -----   [ anon ]
00007f467c968000      4K -----   [ anon ]
00007f467c969000   1024K rw---   [ anon ]
00007f467ca69000      4K -----   [ anon ]
00007f467ca6a000   1024K rw---   [ anon ]

接着咱们分析一下mongodb是怎么使用内存的: 

目前,MongoDB使用的是内存映射存储引擎,它会把磁盘IO操作转换成内存操作,如果是读操作,内存中的数据起到缓存的作用,如果是写操作,内存还可以把随机的写操作转换成顺序的写操作,总之可以大幅度提升性能。MongoDB并不干涉内存管理工作,而是把这些工作留给操作系统的虚拟缓存管理器去处理,这样的好处是简化了MongoDB的工作,但坏处是你没有方法很方便的控制MongoDB占多大内存,事实上MongoDB会占用所有能用的内存,所以最好不要把别的服务和MongoDB放一起。 

有时候,即便MongoDB使用的是64位操作系统,也可能会遭遇臭名昭著的OOM问题,出现这种情况,多半是因为限制了虚拟内存的大小所致,可以这样查看当前值: 

[root@mongodb ~]# ulimit -a | grep 'virtual' 
virtual memory          (kbytes, -v) unlimited

多数操作系统缺省都是把它设置成unlimited的,如果你的操作系统不是,可以这样修改: 

[root@mongodb ~]# ulimit -v unlimited 

不过要注意的是,ulimit的使用是有上下文的,最好放在MongoDB的启动脚本里。 

到底MongoDB配备多大内存合适?宽泛点来说,多多益善,如果要确切点来说,这实际取决于你的数据及索引的大小,内存如果能够装下全部数据加索引是最佳情况,不过很多时候,数据都会比内存大,比如本文说涉及的MongoDB实例: 

MongoDB Enterprise > db.stats();
{
"db" : "loc",
"collections" : 2,
"views" : 0,
"objects" : 1335266749,
"avgObjSize" : 230.06233968311003,
"dataSize" : 307194592376,
"storageSize" : 225892519936,
"numExtents" : 0,
"indexes" : 2,
"indexSize" : 63411568640,
"fsUsedSize" : 338585542656,
"fsTotalSize" : 845376524288,
"ok" : 1
}

索引只有1G多,内存完全能装下,而数据文件则达到了1T,估计很难找到这么大内存,此时保证内存能装下热数据即可,至于热数据有多少,这就是个比例问题了,取决于具体的应用。如此一来内存大小就明确了:内存 > 索引 + 热数据。 

3.解决方法,操作步骤如下:

  (1)限制内存: sysctl -w vm.swappiness=0

  (2)调整内核参数drop_caches释放缓存: 
  # sysctl -w vm.drop_caches=1 

  # echo 3 > /proc/sys/vm/drop_caches

  (3)在Mongodb对应的config中改如下参数:

storage:
  #dbPath: /var/lib/mongo
  dbPath: /home/mongodb/rs/data
  journal:
    enabled: true
  directoryPerDB: true
  engine: wiredTiger
#  mmapv1:
  wiredTiger:
     engineConfig:
        cacheSizeGB: 5
#这个数字是你设置的limit x 60% - 1G,最小1G。

修改配置后重启mongo,以后内存占用就不会自动上升了。

 

根据以上的分析我们可以得出几点结论: 
1. mongodb 直接用操作系统的内存管理器来管理内存。而操作系统采用的是LRU算法淘汰冷数据。 
2. mongodb可以用重启服务、调整内核参数以及调整配置mongodb清理mongodb对内存的缓存。可能存在的问题是:这几种清理方式都是全部清理,这样的话mongodb的内存缓存就失效了。 
3. mongodb 对内存的使用是可以被监控的,在生产环境中要定时的去监控这些数据。 
4. mongodb 对内存这种占用方式使其尽量的和其他占用内存的业务分开部署,例如memcahe,sphinx,mysql等。 
5. 操作系统中的交换分区swap 如果操作频繁的话,会严重降低系统效率。要解决可以禁用交换分区,以及增加内存以及做分布式。 
6.  生产环境中mongodb所在的主机应该尽量的大内存。