设为首页收藏本站

LUPA开源社区

 找回密码
 注册
文章 帖子 博客
LUPA开源社区 首页 业界资讯 开源资讯 查看内容

Hadoop重新设计提供更加简捷和全面的服务

2011-3-22 15:28| 发布者: joejoe0332| 查看: 3826| 评论: 0|原作者: 张龙编译|来自: infoq

摘要:   近日,Yahoo! Hadoop Map-Reduce开发团队领导Arun Murthy展示了针对Hadoop的重新设计过的核心Map-Reduce架构,旨在简化升级、支持更大的集群、更快的恢复,还要支持除了Map-Reduce以外的其他编程范式。重新设计 ...

  近日,Yahoo! Hadoop Map-Reduce开发团队领导Arun Murthy展示了针对Hadoop的重新设计过的核心Map-Reduce架构,旨在简化升级、支持更大的集群、更快的恢复,还要支持除了Map-Reduce以外的其他编程范式。重新设计的Hadoop核心将引擎分割为一个资源管理器,用以支持各种集群计算范式,同时将map-reduce作为一个用户库,组织可以在同一个集群中运行多个版本的map-reduce代码。新的设计非常类似于开源的Mesos集群管理项目——Yahoo!和Mesos对其中的差异进行了评述。

  新方案的主要优势在于:

  • 可伸缩性:支持6000台机器所构成的集群,每台机器拥有16个核心、48GB的RAM、48TB的磁盘大小、100k的并发任务及10k的并发job。
  • 可用性:目前的Job Tracker是单失败点,升级需要停止整个集群才行。
  • 敏捷性:新的设计将map-reduce作为一个用户库,这样同一个集群中所运行的job就可以使用不同的版本了。
  • 更低的延迟:新的设计考虑到了更快的响应、特别是对于小范围的任务。
  • 更好的利用率:毫无疑问,更加精细化的资源与调度模型可以降低资源的浪费。
  • 支持多种编程模型:Murthy说Yahoo内部希望支持其他范式的呼声越来越高,如MPI。

  此次重新设计的主旨在于将职责划分为通用的集群资源管理系统,同时还有一个针对map-reduce的独立应用master,实际上可以是任何的编程模型。这将替换掉Job Tracker和Task Tracker。资源管理系统包含如下集群范围内的控制器:

  • 一个ResourceManager,执行集群范围内的资源调度,如内存、CPU、磁盘、网络等等。
  • 一个Scheduler插件,可以针对ResourceManager实现不同的策略(类似于目前的scheduler API,但却拥有不同的接口,并且需要新的实现)。
  • 每个应用一个ApplicationMaster(比如map-reduce编程),可以请求资源、追踪进度、处理失败,并且可以保持计算状态。



酷毙

雷人

鲜花

鸡蛋

漂亮

相关阅读

  • 快毕业了,没工作经验,
    找份工作好难啊?
    赶紧去人才芯片公司磨练吧!!

最新评论

关于LUPA|人才芯片工程|人才招聘|LUPA认证|LUPA教育|LUPA开源社区 ( 浙B2-20090187 浙公网安备 33010602006705号   

返回顶部