设为首页收藏本站

LUPA开源社区

 找回密码
 注册
文章 帖子 博客
LUPA开源社区 首页 业界资讯 技术文摘 查看内容

新时代应用程序设计及MongoDB的十个深入理解

2014-3-14 11:04| 发布者: 红黑魂| 查看: 3363| 评论: 0|来自: CSDN

摘要: Serendip是个社交音乐服务,用作好友间的音乐分享。基于“人以类聚”这个原因,用户有很大的几率在好友那发现自己喜欢的音乐。Serendip基于AWS构建,使用了的堆栈包括Scala(以及一些Java)、Akka(用以处理并发性) ...

正如前文所说,Serendip为了减少MongoDB中的复杂性而避免使用分片及一些功能,接下来我们为大家带来的是MongoDB资深解决方案架构师所分享的10个MongoDB深入理解:

1. MongoDB同样需要运维。首先,MongoDB是个数据库,因此与其他数据库一样,它需要容量规划、性能调优、监视及维护。请不要因为MongoDB易于安装、开始及比传统关系型数据库更友好就认为MongoDB不需要关心及投入精力,同样不要因为小数据集运行飞快就认为MongoDB不需要优秀的模式、索引策略以及支撑应用程序所需的资源。然而一旦你做了充分的准备并且吃透了那些最佳实践,那么管理一个大型MongoDB集群将只是麻烦而不是伤透脑筋!

2. 成功的MongoDB使用者会监控一切并随时准备好它的增长。跟踪当下的资源使用情况并做合适的容量规划是使用任何数据库系统必备的基础,MongoDB也不能免俗。你必须了解当下集群可以支撑的负载量,也必须清楚在负载峰值时的硬件需求。如果你不清楚负载的增长情况,你必将因为资源耗尽而烦恼。为了监视你的MongoDB部署,你可以使用MongoDB Management Service(MMS)来可视化你的操作。

3. 扩展过程中的困难可能并不符合你的预期。在了解数百用户的部署后,发现性能瓶颈通常会因为以下几个问题产生(影响程度从大到小):

  • 应用程序访问模式设计得不够优化
  • 很差或缺少索引,有时候也会存在太多无效索引
  • 不足以支撑负载的缓慢磁盘或者IOPS
  • 内存容量不足以支撑负载

模式设计不适合应用程序需求是影响性能的首罪,其次就是索引——很差、缺少或者是太多;然而即使这两个方面都没有问题,性能还可能受到磁盘IO的吞吐量限制,特别是写入吞吐量。内存不足会导致许多page faulting并且给磁盘IO带来压力,随着应用规模的增加,系统所需的内存越来越多。

4. 许多MongoDB用户得益于单一的副本集。过早分片容易产生不成熟的优化,不是每个MongoDB部署都需要分片。分片只适合特定的情况,而不是应对“数据库缓慢”的灵丹妙药。如果你有1个错误的模式或者是不恰当的索引,分片不能解决任何问题。只有某个资源在单机或者单副本集情况下产生瓶颈时,并且继续扩展这个资源不符合投资回报比,分片才是最佳优化方案。系统可能会需求更多的IO吞吐量、RAM,亦或是更多的存储或并发性,这些情况下,分片往往比较好的选择。

5. 即使不是将整个数据库放入RAM中,你也可以获得优异的性能。在MongoDB世界里存在一个普遍的误区——将整个数据库放入RAM才可以获得较高的性能。然而取决于负载的类型,这可能是世界上最大的笑话。下面是一个显示和度量,体现了负载不同数据库所需的RAM。如你所见,随着数据库体积的增加,放入RAM中的部分受限于有效的实体存储器。如果RAM的大小不适合性能的需求,你将会看到page faulting,同时随着错误数量的增加,系统的性能不升反降。

 

6. 数据持久化到磁盘。如果磁盘使用率已经达到100%,那么将无法执行更快地写入。你可以在MMS Background flush average图表中查看脏页面从数据文件写入磁盘耗费的时间,从这个趋势来看,随着写入增多,这个过程将花费更多的时间。在这种情况下,你可以通过让磁盘更快、使用更多的分片以及优化应用程序来解决问题。需要注意的是,每个写入都会持久化到磁盘两次——日志及数据文件,将这两个操作划分到不同的物理磁盘上可以切实地降低IO带宽争用。

  

7. 副本不等于备份。所有人都清楚备份的重要性,但是备份为何如此重要?一般情况下该归结于可以从影响到所有副本节点数据的灾难事件中恢复,副本不等于备份的原因非常简单,备份可以阻止数据被一些人为因素破坏——比如,某个人突然的删掉所有生产数据,或者是部署了错误版本的应用程序代码,这都可能让你的部分或者全部数据陷入危险之中。类似的情况下,你必须拥有一个备份来防止灾难的发生。因此,请进行适当的备份,即使你已经使用了文件系统快照Mongodump或者是MMS备份。请不要让你首次备份发生在数据已经被受到威胁之时!

8. 副本集的健康程度不只看Replication lag。Replication lag体现了副本落后于主节点的程度,它只是副本集健康状态的指标之一。与之同等重要的还有replication oplog window,它会基于当下的写入负载计算出 oplog完全恢复所需的时间。换句话说,它表示了一个预计时间——节点发生故障并有能力从中恢复,而无需去执行完全的数据同步。随着时间的推移,系统的写入负载可能会出现波动,replication oplog window同样会随之改变。在峰值负载下,replication oplog window将会缩短,这点在容量规划中是非常重要的。下面是一个MMS的对比视图,显示了跨副本集的replication oplog window:


9. MongoDB不会知道数据需要什么级别的安全。任何数据库的管理都需要建立在“按需访问”之上,原则上最小化的控制权限,因此你必须自己去配置数据库的安全级别。对MongoDB本身的安全限制也是非常重要的,你需要关闭所需访问之外所有的权限。

10. 请勿擅自修改MongoDB的高级选项。虽然MongoDB具备这个功能,但是除非万不得已请勿使用。在问题产生时,对比修改底层参数,更应该做的是定期分析查询及其他力所能及的事。

相关链接:

Building a social music service - the technology behind serendip.me 

10 Things You Should Know About Running MongoDB at Scale   


酷毙

雷人

鲜花

鸡蛋

漂亮
  • 快毕业了,没工作经验,
    找份工作好难啊?
    赶紧去人才芯片公司磨练吧!!

最新评论

关于LUPA|人才芯片工程|人才招聘|LUPA认证|LUPA教育|LUPA开源社区 ( 浙B2-20090187 浙公网安备 33010602006705号   

返回顶部