超详细的mongo备份与恢复工具对比mongodump、mongoexport……
概述
Mongodb提供了mongodump/mongorestore,mongoexport/mongoimport两套机制进行数据备份和恢复,其中mongodump主要进行整库备份,mongoexport则主要进行数据集导出。
公共参数:
–port arg 指定端口 -h arg 指定主机,如:127.0.0.1,也可以直接指定端口号:127.0.0.1:27017 -d arg 指定database -c arg 指定collection –dbpath arg 指定mongod的数据库文件所在路径
备份:
mongodump
命令用法:mongodump [options]
特别参数:
-o arg 输出的”目录“,不指定时,默认在执行命令的路径下创建dump目录导出 -q arg json query,此处可通过json查询,有选择性的导出数据
说明:
1.与mongorestore构成一对工具集,即由Mongodump导出的数据可由mongrestore恢复
2.mongodump可用于“热备份”
3.导出的数据是bson格式
性能:数据库中1g的数据导出后变成285M,大概8秒
mongoexport
命令用法:mongoexport [options]
特别参数:
-q arg 查询过滤器,json string -f args 输出的域,例如-f name,age,address –csv 输出csv,不写此参数,默认为json -o arg 输出的文件,默认为stdout
说明:
1.可以导出json或csv格式的文件
2.可以指定查询过滤器或指定输出的域
3.此工具导出的json,csv可能对某些数据类型不兼容,因此可能不能全部数据导出,mongodump就可以全部兼容。
性能:1g数据,约1分40秒,导出大小为380M
恢复:
mongoimport
命令用法:mongoimport [options]
特别参数:
–file args 导入的文件,若无此参数,以stdin为标准 -f args 导入的数据域 –fieldFile arg 带域名称的文件 –ignoreBlanks 在csv,tsv文件中忽略空域 –type arg 导入文件的类型,默认为json,还可以为csv,tsv –drop 插入前先删除原collection –upsert 插入或更新已存在的对象 –jsonArray 导入json array,目前每个array的限制是4M –headerline 只能用于csv,tsv文件中,用第一行作为文件头
说明:
接受json,csv,tsv格式的文件,每行为一个对象
{“somefield” : 123456, “created_at” : {“$date” : 1285679232000}}此格式可解析日期。
性能:导入1g数据,2分20秒,失败33个对象
mongorestore
命令用法:mongorestore [options] [file or dir to restore]
特别参数:
–drop 导入前先drop collection –objcheck 插入前检测对象的合法性 –filter arg 插入前的过滤器 –indexesLast 插入完数据后再建立索引(此参数可提供更高的性能,建议选用)
说明:
1.与mongodump合用,在restore过程中,索引会重新创造
性能:1g数据,约6分钟
小结:
备份方面:mongodump的速度和压缩率都最好,每秒125M的数据,压缩率达28%
恢复方面:
mongoimport速度较快,但不保证数据完整导入
mongorestore,速度较慢,比mongoimport慢2.5倍左右,但是根据mongodump导出的数据,可以完整导入数据。
后面会分享更多devops和DBA方面的内容,感兴趣的朋友可以关注下~