开始使用MongoDB之前应该知道的14件事

我从事数据库相关工作已经很长时间了,但是最近才开始使用MongoDB。在开始使用MongoDB之前,我希望有些事情我已经知道。根据一般经验,对于数据库是什么以及它们能干什么,人们会有先入为主的认识。为了给他人提供方便,本文列出了一些常见的错误。

创建一个无需身份验证的MongoDB服务器

很遗憾,MongoDB在安装时默认不启用身份验证。在只从本地访问的工作站上,这没什么不好。但是,由于MongoDB是一个多租户系统,它会尽可能地占用内存,因此最好是安装在服务器上,最大限度地提供内存,即使是开发工作。在服务器上使用默认端口安装而不启用身份验证是在自找麻烦,尤其是可以在查询中运行任意JavaScript时(例如把$where作为注入攻击的载体)。 

身份验证方法有多种,但是用户ID/密码凭证最容易安装和管理。当你考虑基于LDAP的身份验证时,可以采用那个方法。在我们谈论安全时,MongoDB必须保持最新,而且,在日志里查找未授权访问的迹象总是值得的。我不喜欢使用默认端口。

忘记限制MongoDB的攻击面

MongoDB的安全检查清单为降低网络渗透和数据泄露风险提供了很好的建议。我们很容易会认为,开发服务器不需要高等级的安全。不是这样的:安全对于所有MongoDB服务器都很重要。尤其是,除非有非常好的理由要使用、或,否则你应该在配置文件中设置javascriptEnabled:false,禁用JavaScript。因为标准MongoDB的数据文件是不加密的,另外,也是一个明智的做法,对数据文件的完全访问仅限于那个用户,这样就可以使用操作系统自带的文件访问控制了。

没有设计一个模式

对于模式,MongoDB没有强制要求。这不是说它不需要模式。如果你真想保存文档而又没有一致的模式,那么你可以非常快速、简单地保存它们,但是检索会十分麻烦

MongoDB模式设计的六大经验原则”是一篇值得一读的经典文章,而第三方工具(如Studio 3T)提供的类似“模式浏览器(Schema Explorer)”这样可以执行定期模式检查的特性也是值得拥有的。

忘记排序规则(排序顺序)

这比其他任何的配置错误都会导致更多的挫折和时间浪费。MongoDB默认使用二进制排序规则。这对任何地方的文化都是不利的。在80年代,大小写敏感、重音敏感、二进制排序规则,和念珠、土耳其长衫和卷胡子一起,被视为奇怪的时代错误。现在,他们没法辩解了。在现实生活中,motorbike和Motorbike就是一样,而Britain和britain就是同一个地方。小写字母和大写字母只是书写上的等价。就不要让我再说重音字符排序规则了。当你创建一个MongoDB数据库时,使用一种合乎系统用户语言和文化重音敏感、大小写敏感排序规则。这使得字符串数据的检索容易许多。

创建大文档集合

MongoDB乐于把最大16MB的文档置于集合中,而设计用于超过16MB的大文档。但是,可以容纳大文档并不意味着那是一个好主意。MongoDB在单个文档的大小为几KB时表现最好,处理它们的方式更像宽SQL表的行。大文档会导致多种性能问题

使用大数组创建文档

文档可以包含数组。最好是把数组元素的数量保持在四位数以下。如果数组频繁添加,会使得包含它的文档过大,那样,,反过来,这意味着。当一个包含大数组的文档重新索引时,由于每个数组元素都有一个单独的索引条目,所以会发生大量的索引重写。此外,这种重新索引在这类文档插入或删除时也会发生。

为了最小化这个问题,MongoDB有一个“填充因子()”,为文档增长提供空间。

你也许会想,你可以通过不建立数组索引来绕开这个问题。遗憾的是,没有索引,你会遇到其他问题。因为文档会从头到尾扫描,找到一个接近数组尾部的元素需要花更多的时间,大部分处理这个文档的操作都会变慢

忘记聚合情况下的阶段排序

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/9b60cf3c6d6e7c1ac9422ad91db114da.html