这段时间对memcache,redis,mongodb 3种nosql进行了熟悉,简单的总结了下。
1.从3者的性能来看,memcache性能是最好的,redis次之(redis有单进程限制,会碰到cpu 100%的限制,这个也比较难比较,一个多进程,一个单进程)
2.从ha和scale out的角度来看,mongodb的灵活性和可用性最高。。memcache本身不怎么支持高可用。。需要前端实现persistence hash或者proxy。。
Redis虽然支持m-s和m-s-s的结构,但是其对网络的依赖比较大,m-s之间的丢包也可能导致一次全量的镜像产生。
Redis和memcache的横向扩展方式是一样的,但是单个的redis比较容易遇到cpu的瓶颈
3.从存储的数据类型来看,mongodb最丰富,而且操作也比较灵活,支持类sql的查询。。memcache是纯粹的key-value,数据结构单一
4.从数据的备份角度来看,memcache数据备份不太方便,需要3方工具,redis可以用持久化,mongodb的数据备份方法则比较多。
总结来说;
1.如果业务对数据的持久化没什么要求,数据结构比较单一,目的是做前端缓存的话,memcache会提供比较好的性能表现
2.如果业务对数据的持久化有要求,需要备份,支持读写分离的话,用redis做缓存比较合适(也可以做一部分的后端存储)
3.mongodb主要是用在大量数据的后端存储上,支持auto sharding和自动故障转移,可用性比较高和hadoop群集类似
目前我们对nosql的使用还不太完善,包括一些监控,比如redis的定时monitor监控。对性能的分析也基本没有。。
比如redis和mongodb都是有slow log的,但是我们线上都没有开启更没有进行分析。。。这个可能是后续要做的事情。。
下面是一个简单的对比表:
对比参数 | memcache | redis | mongodb |
数据库类型 | 纯粹的key-value数据库,数据结构单一 | 结构化数据库 | 对象数据库 |
支持数据类型 | string | string,list,sort,sorted,hash | 丰富的数据表达,索引,类似于关系型数据库 |
可用性 | 没有数据冗余机制,使用一致性hash增加可用性 | 支持ms,mss结构,slave重连主节点会导致一次全量同步产生,影响性能和效率。可以实现读写分离,slave重连使用全量数据,性能和效率会有问题,不支持自动sharding,需要程序上实现一致性hash | 支持ms,支持replication set,set可以自动故障转换,支持auto sharding |
持久化支持 | 数据完全放在内存中,没有持久化支持 | 支持持久化,快照持久化和aof持久化 | 1.8版本开始采用binlog方式支持持久化的可靠性 |
内存空间优化 | 最大内存限制,LRU算法淘汰(可选) | 独立的vm机制,最大内存限制,数据ttl过期设置,内存淘汰(可选) | 依赖于操作系统的vm管理机制,使用内存映射文件,把剩余内存作为缓存使用,没有最大内存限制,数据存在文件系统上和内存 |
是否是多线程 | 是,可以通过-t控制进线程数 | 单线程 | 多线程 |
性能 | 15W/s的GET,11W/s的SET | 单个实例qps:8.5W左右(GET/SET)(RH2285) | 单个qps:3.5W左右(GET/SET)(RH2285) |
事务支持 | 并发场景下,用cas保证一致性 | 事务支持比较弱,保证每个事务操作连续执行,如果一个操作失败,不会回滚。使用乐观锁实现cas。 | 不支持事务 |
数据分析 | 简单的get查询功能 | 简单查询功能,支持对集合和hash的操作等 | 查询方便,有类似于sql的语法,支持条件查询 |
应用场景 | 常作为前端缓存 | 缓存和数据存储,队列 | 大数据量存储 |
feature | | 支持使用pipeline减少查询次数 | auto sharding,故障自动切换,mapreduce支持,大文件下的GridFs文件系统 |
安全性问题 | 目前没有身份验证 | 支持密码验证(requirepass) | 支持collection级别的身份验证(auth) |
数据备份和还原 | 数据存放于内存中,不方便备份和还原(stats cachedump) | 可以使用持久化做备份和还原 | mongodump倍份,mogorestore还原。数据导出:mongoexport,mongoimport,导出数据支持csv格式 |
slowlog相关 | 没有slowlog相关的设置 | 支持slowlog,slowlog存在于数据库中,使用slowlog get获取相关日志,slowlog的大小有限制,超过后会删除旧的 | 支持slowlog(profiling),slowlog存在于system.profile(capped collection)的collection中 |
状态查看 | stats | info | mongostat,db.serverStatus(),db.stats(),rs.statsu()等 |
前操作查看 | | monitor | mongosniff,db.currentOp() |
tunning | 1.object size不要太大(默认只支持1M) 2.object 的expires设置(缓存应该具有超时的特点) 3.适合数据处理后的缓存,不适合缓存后的处理输出 | 1.开启vm,将不常用的value值给交换到磁盘上 2.尽量将数据存放在内存中 3.前端使用proxy或persistence hash来实现均衡访问 4.使用master-slave结构,做读写分离 5.大数据量时持久化数据dump时影响服务,应该放在slave端做 6.使用pipeline聚合访问 7.网卡bonding | 1.索引相关(读多写少时) 2.explain解析查询 3.限定返回条目(limit) 4.只查看指定需要字段,不查询所有字段 5.使用capped collection (特殊业务) 6.使用repl sets,扩展整体集群能力 |