【MongoDB数据库环境介绍】
近期,数据恢复中心恢复了某地海关的一台MongoDB数据,首先介绍数据库环境:
发生数据丢的数据库位于一台虚拟机上,虚拟机操作系统为WindowsServer 2012。由于业务需要对数据库内的文件进行迁移,于是管理员在MongoDB服务开启状态下将数据库文件复制到其他分区,原始数据库分区下的数据进行了格式化操作。但迁移后的数据无法使用,管理员将数据拷贝回原始分区后MongoDB服务依然无法使用,并报错“Windows无法启动MongoDB服务(位于 本地计算机 上)错误1067:进程意外终止。”
【MongoDB数据库故障情况初检】
工程师通过客户的描述进行了初步了解,通常情况下,如果MongoDB服务尚未关闭情况下对数据库文件进行拷贝回导致致mongod.lock和WiredTiger.lock这两个文件拷贝出错,这种情况出现后可以在拷贝文件中找到这两个文件并删除,再次启动MongoDB后数据库会自动重新生成这两个文件,数据库即可正常启动。
随后工程师按照这一预判对客户迁移出的文件进行检测,但出乎意料的是迁移出的数据库文件中丢失了_mdb_catalog.wt文件。
mdb_catalog.wt文件是专门用于存储MongoDB中所有集合元数据的文件,数据库启动时所必须读取的相关信息都存储于改文件中。所以,导致客户数据库启动报错的原因应该是丢失了mdb_catalog.wt文件导致的数据库无法获取集合赌赢的WT table名字,集合的创建选项,集合的索引信息等元数据,这才导致了数据库启动报错。
【数据库数据恢复】
数据恢复工程师首先对数据库分区进行底层数据扫描,但并没有扫描到关于_mdb_catalog.wt文件的信息,后经过调整扫描方式多次尝试,仍然无法查找相关信息,确定改文件已被覆盖,无法通过回复_mdb_catalog.wt文件修复数据库。
于是数据恢复工程师调整数据恢复策略,由于客户的数据库是基于WiredTiger存储引擎的数据库系统,在Windows环境下编译出可执行的wt工具。
借助编译后的wt工具对数据库集合文件内所有数据清洗回写,读取数据结果写入到文件中。创建一个全新的MongoDB数据库,创建相应数据量的集合,将文件逐一写入集合中,查询数据集并重建索引信息。
通过查询集合中的记录,确定记录类型,重建集合索引,集合恢复完成,可以正常查看其中数据:
【检验数据并确认数据恢复成功】
协助客户对全部集合进行索引重建之后,客户对数据库整体进行查询验证,数据无误,此次数据恢复圆满成功。