MongoDB中的参数限制与阀值详析

lbyd0

2019-04-03

关注关注

前言

今天搜索spark mongo的资料，意外发现了MongoDB的一些知识，这些都是之前没有接触过的，所以专门记录下。 (๑• . •๑)

下面话不多说了，来一起看看详细的介绍吧

一、BSON文档

BSON文档尺寸：一个document文档最大尺寸为16M；大于16M的文档需要存储在GridFS中。
文档内嵌深度：BSON文档的结构（tree）深度最大为100。

二、Namespaces

collection命名空间：.，最大长度为120字节。这也限定了database和collection的名字不能太长。
命名空间的个数：对于MMAPV1引擎，个数最大为大约为24000个，每个collection以及index都是一个namespace；对于wiredTiger引擎则没有这个限制。
namespace文件的大小：对于MMAPV1引擎而言，默认大小为16M，可以通过在配置文件中修改。wiredTiger不受此限制。

三、indexes

index key：每条索引的key不得超过1024个字节，如果index key的长度超过此值，将会导致write操作失败。
每个collection中索引的个数不得超过64个。
索引名称：我们可以为index设定名称，最终全名为..$，最长不得超过128个字节。默认情况下为filed名称与index类型的组合，我们可以在创建索引时显式的指定index名字，参见createIndex()方法。
组合索引最多能包含31个field。

四、Data

Capped Collection：如果你在创建“Capped”类型的collection时指定了文档的最大个数，那么此个数不能超过2的32次方，如果没有指定最大个数，则没有限制。
Database Size：MMAPV1引擎而言，每个database不得持有超过16000个数据文件，即单个database的总数据量最大为32TB，可以通过设置“smallFiles”来限定到8TB。
Data Size：对于MMAVPV1引擎而言，单个mongod不能管理超过最大虚拟内存地址空间的数据集，比如linux（64位）下每个mongod实例最多可以维护64T数据。wiredTiger引擎没有此限制。
每个Database中collection个数：对于MMAPV1引擎而然，每个database所能持有的collections个数取决于namespace文件大小（用来保存namespace）以及每个collection中indexes的个数，最终总尺寸不超过namespace文件的大小（16M）。wiredTiger引擎不受到此限制。

五、Replica Sets

每个replica set中最多支持50个members。
replica set中最多可以有7个voting members。（投票者）
如果没有显式的指定oplog的尺寸，其最大不会超过50G。

六、Sharded Clusters

group聚合函数，在sharding模式下不可用。请使用mapreduce或者aggregate方法。
Coverd Queries：即查询条件中的Fields必须是index的一部分，且返回结果只包含index中的fields；对于sharding集群，如果query中不包含shard key，索引则无法进行覆盖。虽然_id不是“shard key”，但是如果查询条件中只包含_id，且返回的结果中也只需要_id字段值，则可以使用覆盖查询，不过这个查询似乎并没有什么意义（除非是检测此_id的document是否存在）。
对于已经存有数据的collections开启sharding（原来非sharding），则其最大数据不得超过256G。当collection被sharding之后，那么它可以存储任意多的数据。
对于sharded collection，update、remove对单条数据操作（操作选项为multi:false或者justOne），必须指定shard key或者_id字段；否则将会抛出error。
唯一索引：shards之间不支持唯一索引，除非这个“shard key”是唯一索引的最左前缀。比如collection的shard key为{“zipcode”:1,”name”: 1}，如果你想对collection创建唯一索引，那么唯一索引必须将zipcode和name作为索引的最左前缀，比如：collection.createIndex({“zipcode”:1,”name”:1,”company”:1},{unique:true})。
在chunk迁移时允许的最大文档个数：如果一个chunk中documents的个数超过250000（默认chunk大小为64M）时，或者document个数大于 1.3 *（chunk最大尺寸（有配置参数决定）/ document平均尺寸），此chunk将无法被“move”（无论是balancer还是人工干预），必须等待split之后才能被move。

七、shard key

shard key的长度不得超过512个字节。
“shard key索引”可以为基于shard key的正序索引，或者以shard key开头的组合索引。shard key索引不能是multikey索引（基于数组的索引）、text索引或者geo索引。
Shard key是不可变的，无论何时都不能修改document中的shard key值。如果需要变更shard key，则需要手动清洗数据，即全量dump原始数据，然后修改并保存在新的collection中。
单调递增（递减）的shard key会限制insert的吞吐量；如果_id是shard key，需要知道_id是ObjectId()生成，它也是自增值。对于单调递增的shard key，collection上的所有insert操作都会在一个shard节点上进行，那么此shard将会承载cluster的全部insert操作，因为单个shard节点的资源有限，因此整个cluster的insert量会因此受限。如果cluster主要是read、update操作，将不会有这方面的限制。为了避免这个问题，可以考虑使用“hashed shard key”或者选择一个非单调递增key作为shard key。（rang shard key 和hashed shard key各有优缺点，需要根据query的情况而定）。

八、Operations

如果mongodb不能使用索引排序来获取documents，那么参与排序的documents尺寸需要小于32M。
Aggregation Pileline操作。Pipeline stages限制在100M内存，如果stage超过此限制将会发生错误，为了能处理较大的数据集，请开启“allowDiskUse”选项，即允许pipeline stages将额外的数据写入临时文件。

九、命名规则

database的命名区分大小写。
database名称中不要包含：/ .‘'$*<>:|?
database名称长度不能超过64个字符。
collection名称可以以“_”或者字母字符开头，但是不能包含”$”符号，不能为空字符或者null，不能以“system.”开头，因为这是系统保留字。
document字段名不能包含“.”或者null，且不能以“$”开头，因为$是一个“引用符号”。

最后记录下json嵌套中含有列表的查询方法，样例数据：

{
 "_id" : ObjectId("5c6cc376a589c200018f7312"),
 "id" : "9472",
 "data" : {
 "name" : "测试",
 "publish_date" : "2009-05-15",
 "authors" : [ 
  {
  "author_id" : 3053,
  "author_name" : "测试数据"
  }
 ],
 }
}

我要查询authors中的author_id，query可以这样写：

db.getCollection().find({'data.authors.0.author_id': 3053})

用0来代表第一个索引，点代表嵌套结构。但是spark mongo中是不能这样导入的，需要使用别的方法。

总结

mongodb namespace

lbyd0

0 关注 0 粉丝 0 动态

关注关注

分布式文档存储数据库之MongoDB访问控制的操作方法

　　什么是访问控制？

fengzhongdengdai 2020-11-17

分布式文档存储数据库之MongoDB备份与恢复的实践详解

　　为什么要备份？　　备份的目的是对数据做冗余的一种方式，它能够让我们在某种情况下保证最少数据的丢失；之前我们对mongodb做副本集也是对数据做冗余，但是这种在副本集上做数据冗余仅仅是针对系统故障或服务异常等一些非人为的故障发生时，保证数据服务的可用性；

lbyd0 2020-11-17

Pycharm连接MongoDB数据库安装教程详解

BigYellow 2020-11-16

分布式文档存储数据库之MongoDB分片集群的问题

　　1、什么是分片？比如用户要查询年龄大于30的用户，该怎么查询呢？而年龄大于30的用户的数据，可能server1上有一部分数据，server2上有部分数据，我们怎么才能够把所有满足条件的数据全部查询到呢？

sushuanglei 2020-11-12

MongoDB数据库用户角色和权限管理详解

使用终端命令行输入 mongo 登陆 mongodb 之后切换到 admin 库，并认证后可查看所有数据库，操作如下所示：。Implicit session: session { "id" : UUID }. 说明：1 表示认证成功，0

我心似明月 2020-11-09

利用golang驱动操作MongoDB数据库的步骤

MongoDB中的JSON文档以称为BSON的二进制表示形式存储。与其他将JSON数据存储为简单字符串和数字的数据库不同，BSON编码扩展了JSON表示形式，例如int，long，date，float point和decimal128。这使应用程序更容易可

zhushenghan 2020-11-09

ubuntu安装mongodb创建账号和库及添加坐标索引的流程分析

... roles: [ { role: "readWrite", db: "lbs" },　　4.3移除数据库和日志文件

sunnnyduan 2020-10-16

MongoDB查询之高级操作详解（多条件查询、正则匹配查询等）

MongoDB查询文档使用find()方法，同时find()方法以非结构化的方式来显示所有查询到的文档。db.collection.find -- 返回所有符合查询条件的文档。$type操作符是基于BSON类型来检索集合中匹配的数据类型，MongoDB中可

不要皱眉 2020-10-14

SpringBoot+MongoDB实现物流订单系统的代码

我们都知道MongoDB是一款非常出色的非关系型文档数据库，你肯定会想问MongoDB这么强，我们该怎么用或者有啥运用场景呢？MongoDB的应用场景非常多，无论是数据存储还是日志存储越来越多的公司在使用MongoDB，而我们今天也在SpringBoot基

xiaohai 2020-09-29

MongoDb CPU利用率过高问题如何解决

在公司的项目中，突然出现过一个情况，mongodb 的CPU利用率到达100%,导致服务器这边卡死了，请求了半天无响应，提示请求超时。因为，当时APP用户可能会在某一个时间段集中的使用，所以，请求量一下子就飙上去了，刚好APP打开请求的时候，有一个mong

songxiugongwang 2020-09-22

flask_16：通过 MongoEngine 使用 MongoDB

使用一个 MongoDB 之类的文档型数据库来代替关系 SQL 数据是很常见的。本方案演示如何使用文档映射库MongoEngine来集成 MongoDB 。基本的配置是在app.config中定义MONGODB_SETTINGS并创建一个MongoEng

萌亖 2020-09-17

MongoDB通配符索引的用法实例

MongoDB在4.2 版本推出了Wildcard Indexes，究竟什么是Wildcard Indexes以及Wildcard Indexes适合哪些场景本文结合官方文档以及实际测试进行简单概述。因为MongoDB是dynamic schemas，所以

LuckyLXG 2020-09-08

MongoDB 用户管理

小小最近接触了MongoDB，所以这里开始学习MongoDB，之用户管理模块的相关内容。使用如上的命令，切换数据库到admin数据库。cusomData 字段，任意内容，可以是用户名的全民介绍。roles 字段指定用户的角色，用于给一个空数组，给新用户设

sdmzhu 2020-09-01

MongoDB如何查看版本信息详解

它处理数据请求，管理数据存储，和执行后台管理操作。当我们运行mongod命令意味着正在启动MongoDB进程,并且在后台运行。mongo是一个命令行工具用于连接一个特定的mongod实例。当我们没有带参数运行mongo命令它将使用默认的端口号和localh

mkhhxxttxs 2020-09-16

Centos7 yum安装mongodb实现步骤详解

复制和高可用性：支持服务器之间的数据复制，支持主-从模式及服务器之间的相互复制。复制的主要目的是提供冗余及自动故障转移。#这里可以修改 gpgcheck=0, 省去gpg验证[root@localhost ~]# yum makecache. system

xiaohai 2020-09-16

Docker 搭建集群MongoDB的实现步骤

由于公司业务需要，我们打算自己搭建 MongoDB 的服务，因为 MongoDB 的云数据库好贵，我们这次采用副本集的方式来搭建集群，三台服务器，一主、一副、一仲裁。Replica Set 副本集：一个副本集就是一组 MongoDB 实例组成的集群，由一个

newcome 2020-09-09

mongodb的聚合操作

聚合是MongoDB的高级查询语言，它允许我们通过转化合并由多个文档的数据来生成新的在单个文档里不存在的文档信息。MongoDB中聚合主要用于处理数据，并返回计算后的数据结果，有点类似sql语句中的 count(*)。Pipeline查询速度快于MapRe

jaylong 2020-08-19

mongodb的java客户端

<artifactId>spring-boot-starter-data-mongodb</artifactId>. private Long id;private String userName;private String pa

大秦铁骑 2020-08-19

mongodb的java客户端

<artifactId>spring-boot-starter-data-mongodb</artifactId>. private Long id;private String userName;private String pa

thatway 2020-08-19

mongodb的java客户端

<artifactId>spring-boot-starter-data-mongodb</artifactId>. private Long id;private String userName;private String pa

lovecodeblog 2020-08-19

安科网

MongoDB中的参数限制与阀值详析

lbyd0

lbyd0

相关推荐

分布式文档存储数据库之MongoDB访问控制的操作方法

分布式文档存储数据库之MongoDB备份与恢复的实践详解

Pycharm连接MongoDB数据库安装教程详解

分布式文档存储数据库之MongoDB分片集群的问题

MongoDB数据库用户角色和权限管理详解

利用golang驱动操作MongoDB数据库的步骤

ubuntu安装mongodb创建账号和库及添加坐标索引的流程分析

MongoDB查询之高级操作详解（多条件查询、正则匹配查询等）

SpringBoot+MongoDB实现物流订单系统的代码

MongoDb CPU利用率过高问题如何解决

flask_16：通过 MongoEngine 使用 MongoDB

MongoDB通配符索引的用法实例

MongoDB 用户管理

MongoDB如何查看版本信息详解

Centos7 yum安装mongodb实现步骤详解

Docker 搭建集群MongoDB的实现步骤

mongodb的聚合操作

mongodb的java客户端

mongodb的java客户端

mongodb的java客户端

lbyd0