在本篇博客中我们主要讨论下博客的管理。因为已经在前面五篇中写了具体的实例,因此这里就不再举例说明。
一、监控
分片集群是整个体系中比較复杂的一块,因此更应该须要监控。
主要命令: serverstatus和currentOp()
二、手动分区
手动分区意思就是手动对线上分片集群的块进行拆分和迁移。一般而言,一个分片写的越多。它越大。 movechunk命令在这样的情况下相同有帮助
三、添加一个分片
sh.addShard("computername:port")
使用这样的方式添加容量,要注意向新分片迁移数据所花费的时间。估计迁移速度是每分钟100~200M。最好在索引和工作集达到现有计划加入新分片。
四、删除分片
在一些非常少见的情况下,你可能想删除一个分片,能够通过命令removeshard命令进行删除。一旦分片被清空,你还要确认将要删除的分片不是数据库的主分片,能够通过命令config.databases集合进行查询;
db.databases.find()
五、集合去分片
尽管能够删除一个分片,可是没有正式的路径去掉集合的分片。
做法就是先用mongodump命令导出数据然后再用mongorestore来恢复数据。
六、备份分片集合
要备份分片集群。就是须要配置数据以及每一个分片数据的副本。一种方式是利用monodump命令来导出数据。还有一方式就是从每一个分片的一个成员里复制数据文件,再从还有一台server中复制数据文件。
不管那种方式,要确认再备份系统的时候没有块处在移动过程中。
停止均衡器:use config; db.setting.update({_id:"balancer"},{$set:{stopped:true},true})
备份之前又一次确认: use config, db.locks.find({"_id":"balancer"})
备份之后别忘了启动均衡器
sh.setBalancerState()
sh.isBalancerRunning()
七、故障转移和恢复
分片成员故障,自己主动会转移到其它副本集一员。假设有不正常的表现,能够利用重新启动mongos进行进行重置
配置server故障:一个分片集群一般有三台配置server,假设有两台发生问题,那么剩余的配置server变为仅仅读状态,全部的拆分和均衡操作都会停止。这个对集群的读写没有影响,当三条配置server恢复后。均衡器就会它停止的地方那个又一次開始工作
mongos故障:假设mongos进程发生问题。一般重新启动应用server;