mongodb 占用内存及解决方法

转载

mob604756e5abbc 2021-07-16 11:24:00

文章标签 mongodb 数据 3g sed 虚拟内存 文章分类 大数据

1.先了解一下linux对内存的管理方式：
在Linux里（别的系统也差不多），内存有物理内存和虚拟内存之说，物理内存是什么自然无需解释，虚拟内存实际是物理内存的抽象，多数情况下，出于方便性的考虑，程序访问的都是虚拟内存地址，然后操作系统会把它翻译成物理内存地址。
很多人会把虚拟内存和Swap混为一谈，实际上Swap只是虚拟内存引申出的一种技术而已：操作系统一旦物理内存不足，为了腾出内存空间存放新内容，就会把当前物理内存中的内容放到交换分区里，稍后用到的时候再取回来，需要注意的是，Swap的使用可能会带来性能问题，偶尔为之无需紧张，糟糕的是物理内存和交换分区频繁的发生数据交换，这被称之为Swap颠簸，一旦发生这种情况，先要明确是什么原因造成的，如果是内存不足就好办了，加内存就可以解决，不过有的时候即使内存充足也可能会出现这种问题。解决方法是限制使用Swap：

[root@mongodb ~]# sysctl -w vm.swappiness=0

查看内存情况最常用的是free命令：

[root@mongodb ~]# free -m
              total        used        free      shared  buff/cache   available
Mem:           7822        5093         129           0        2599        2443
Swap:             0           0           0

新手看到used一栏数值偏大，free一栏数值偏小，往往会认为内存要用光了。其实并非如此，之所以这样是因为每当我们操作文件的时候，Linux都会尽可能的把文件缓存到内存里，这样下次访问的时候，就可以直接从内存中取结果，所以cached一栏的数值非常的大，不过不用担心，这部分内存是可回收的，操作系统会按照LRU算法淘汰冷数据。除了cached，还有一个buffers，它和cached类似，也是可回收的，不过它的侧重点在于缓解不同设备的操作速度不一致造成的阻塞，这里就不多做解释了。
知道了原理，我们就可以推算出系统可用的内存是free + buffers + cached，至于系统实际使用的内存是used – buffers – cached。

除了free命令，还可以使用sar命令：

[root@mongodb ~]# sar -r
Linux 3.10.0-514.6.2.el7.x86_64 (mongodb)       07/16/2021      _x86_64_        (4 CPU)

12:00:01 AM kbmemfree kbmemused  %memused kbbuffers  kbcached  kbcommit   %commit  kbactive   kbinact   kbdirty
12:10:01 AM    178424   7832016     97.77     12600    997560   7404844     92.44   7050672    527532       124
12:20:01 AM    132188   7878252     98.35     12628   1043284   7404820     92.44   7068096    556064        80
12:30:01 AM    152124   7858316     98.10     12544   1023568   7404788     92.44   7078700    525200        92
12:40:01 AM    168408   7842032     97.90     15228   1005108   7404800     92.44   7053724    534792       144
12:50:02 AM    150300   7860140     98.12     12688   1009264   7434844     92.81   7075148    530472       664
01:00:01 AM    129680   7880760     98.38     10624   1033012   7422296     92.66   7084864    541296       372
01:10:01 AM    135820   7874620     98.30      6452   1054888   7422292     92.66   7088364    537704     17972
01:20:01 AM    146848   7863592     98.17      8180   1063844   7422324     92.66   7077476    539528     34080
01:30:01 AM    130196   7880244     98.37      8616   1089936   7419544     92.62   7074288    558760     31048

[root@mongodb ~]# sar -W
Linux 3.10.0-514.6.2.el7.x86_64 (mongodb) 07/16/2021 _x86_64_ (4 CPU)

12:00:01 AM pswpin/s pswpout/s
12:10:01 AM 0.00 0.00
12:20:01 AM 0.00 0.00
12:30:01 AM 0.00 0.00
12:40:01 AM 0.00 0.00
12:50:02 AM 0.00 0.00
01:00:01 AM 0.00 0.00

2.看一个MongoDB服务器的top命令结果:

[root@mongodb ~]# top -p $(pidof mongod)

top - 10:25:25 up 1074 days, 21:31,  2 users,  load average: 0.77, 0.63, 0.58
Tasks:   1 total,   0 running,   1 sleeping,   0 stopped,   0 zombie
%Cpu(s):  6.8 us,  1.1 sy,  0.0 ni, 91.6 id,  0.5 wa,  0.0 hi,  0.1 si,  0.0 st
KiB Mem :  8010440 total,   848492 free,  5102988 used,  2058960 buff/cache
KiB Swap:        0 total,        0 free,        0 used.  2621556 avail Mem 

  PID USER      PR  NI    VIRT    RES    SHR S  %CPU %MEM     TIME+ COMMAND                                                         
 8416 root      20   0 3543440 2.385g   9864 S  29.3 31.2   6:52.62 mongod

或者先top后，然后 shift+m 把当前进场按占用内存的多少排序。看看你的mongodb能占用多少内存。

平时可以通过mongo命令行来监控MongoDB的内存使用情况，如下所示：

MongoDB Enterprise > db.serverStatus().mem;
{
        "bits" : 64,
        "resident" : 2588,
        "virtual" : 3612,
        "supported" : true,
        "mapped" : 0,
        "mappedWithJournal" : 0
}

还可以通过mongostat命令来监控MongoDB的内存使用情况，如下所示：

[root@mongodb ~]# mongostat  --authenticationDatabase=admin
insert query update delete getmore command dirty  used flushes vsize   res qrw arw net_in net_out conn                time
  1636    *0     *0     *0       0     4|0  8.0% 80.1%       0 3.53G 2.53G 0|0 1|0   452k    105k   13 Jul 16 10:42:39.357
  1620    *0     *0     *0       0     3|0  8.0% 80.1%       0 3.53G 2.53G 0|0 1|0   450k    103k   13 Jul 16 10:42:40.358
  1671    *0     *0     *0       0     1|0  7.9% 80.0%       0 3.53G 2.53G 0|0 1|0   460k    103k   13 Jul 16 10:42:41.358
  1630    *0     *0     *0       0     2|0  8.1% 80.0%       0 3.53G 2.53G 0|0 1|0   450k    103k   13 Jul 16 10:42:42.356
  1626    *0     *0     *0       0     1|0  7.9% 79.9%       0 3.53G 2.53G 0|0 1|0   451k    103k   13 Jul 16 10:42:43.356

其中内存相关字段的含义是：
mapped：映射到内存的数据大小
visze：占用的虚拟内存大小
res：实际使用的内存大小
注：如果操作不能再内存中完成，结果faults列的数值不会是0，视大小可能有性能问题。

vsize是mapped的两倍，而mapped等于数据文件的大小，所以说vsize是数据文件的两倍，之所以会这样，是因为本例中，MongoDB开启了journal，需要在内存里多映射一次数据文件，如果关闭journal，则vsize和mapped大致相当。

如果想验证这一点，可以在开启或关闭journal后，通过pmap命令来观察文件映射情况：

[root@mongodb ~]# pmap $(pidof mongod) 
8416:   /usr/local/mongodb/bin/mongod --config=/usr/local/mongodb/mongodb.conf
00001190f3743000 655360K -----   [ anon ]
00007f467c968000      4K -----   [ anon ]
00007f467c969000   1024K rw---   [ anon ]
00007f467ca69000      4K -----   [ anon ]
00007f467ca6a000   1024K rw---   [ anon ]

接着咱们分析一下mongodb是怎么使用内存的：

目前，MongoDB使用的是内存映射存储引擎，它会把磁盘IO操作转换成内存操作，如果是读操作，内存中的数据起到缓存的作用，如果是写操作，内存还可以把随机的写操作转换成顺序的写操作，总之可以大幅度提升性能。MongoDB并不干涉内存管理工作，而是把这些工作留给操作系统的虚拟缓存管理器去处理，这样的好处是简化了MongoDB的工作，但坏处是你没有方法很方便的控制MongoDB占多大内存，事实上MongoDB会占用所有能用的内存，所以最好不要把别的服务和MongoDB放一起。

有时候，即便MongoDB使用的是64位操作系统，也可能会遭遇臭名昭著的OOM问题，出现这种情况，多半是因为限制了虚拟内存的大小所致，可以这样查看当前值：

[root@mongodb ~]# ulimit -a | grep 'virtual' 
virtual memory          (kbytes, -v) unlimited

多数操作系统缺省都是把它设置成unlimited的，如果你的操作系统不是，可以这样修改：

[root@mongodb ~]# ulimit -v unlimited

不过要注意的是，ulimit的使用是有上下文的，最好放在MongoDB的启动脚本里。

到底MongoDB配备多大内存合适？宽泛点来说，多多益善，如果要确切点来说，这实际取决于你的数据及索引的大小，内存如果能够装下全部数据加索引是最佳情况，不过很多时候，数据都会比内存大，比如本文说涉及的MongoDB实例：

MongoDB Enterprise > db.stats();
{
"db" : "loc",
"collections" : 2,
"views" : 0,
"objects" : 1335266749,
"avgObjSize" : 230.06233968311003,
"dataSize" : 307194592376,
"storageSize" : 225892519936,
"numExtents" : 0,
"indexes" : 2,
"indexSize" : 63411568640,
"fsUsedSize" : 338585542656,
"fsTotalSize" : 845376524288,
"ok" : 1
}

索引只有1G多，内存完全能装下，而数据文件则达到了1T，估计很难找到这么大内存，此时保证内存能装下热数据即可，至于热数据有多少，这就是个比例问题了，取决于具体的应用。如此一来内存大小就明确了：内存 > 索引 + 热数据。

3.解决方法,操作步骤如下：

(1)限制内存: sysctl -w vm.swappiness=0

(2)调整内核参数drop_caches释放缓存：
　　# sysctl -w vm.drop_caches=1

　　# echo 3 > /proc/sys/vm/drop_caches

(3)在Mongodb对应的config中改如下参数:

storage:
  #dbPath: /var/lib/mongo
  dbPath: /home/mongodb/rs/data
  journal:
    enabled: true
  directoryPerDB: true
  engine: wiredTiger
#  mmapv1:
  wiredTiger:
     engineConfig:
        cacheSizeGB: 5
#这个数字是你设置的limit x 60% - 1G,最小1G。

修改配置后重启mongo,以后内存占用就不会自动上升了。

根据以上的分析我们可以得出几点结论：
1. mongodb 直接用操作系统的内存管理器来管理内存。而操作系统采用的是LRU算法淘汰冷数据。
2. mongodb可以用重启服务、调整内核参数以及调整配置mongodb清理mongodb对内存的缓存。可能存在的问题是：这几种清理方式都是全部清理，这样的话mongodb的内存缓存就失效了。
3. mongodb 对内存的使用是可以被监控的，在生产环境中要定时的去监控这些数据。
4. mongodb 对内存这种占用方式使其尽量的和其他占用内存的业务分开部署，例如memcahe，sphinx，mysql等。
5. 操作系统中的交换分区swap 如果操作频繁的话，会严重降低系统效率。要解决可以禁用交换分区，以及增加内存以及做分布式。
6. 生产环境中mongodb所在的主机应该尽量的大内存。