设为首页收藏本站

LUPA开源社区

 找回密码
 注册
文章 帖子 博客
LUPA开源社区 首页 业界资讯 开源资讯 查看内容

Hadoop虚拟化的性能对比和调优经验

2013-11-11 12:26| 发布者: joejoe0332| 查看: 3494| 评论: 0|原作者: 51CTO|来自: 51CTO

摘要:   虚拟化为Hadoop注入了前所未有的活力,从IT生产管理的角度,表现为以下几点:·Hadoop和其他消耗不同类型资源的应用一起部署共享数据中心可以提高总体资源利用率;·灵活的虚拟机操作使得用户可以动态的根据数据 ...


  Hadoop虚拟化的调优经验:


(1)计划初始规模:集群表现于跟数据中心基础设施和配置密切相关,建议用户在一开始对环境表现难以预测的时候,先建立小规模集群,比如5台或者6台服务器,部署Hadoop,然后运行标准Hadoop基准了解自己数据中心的特点。然后根据需要逐步添加服务器和存储等资源。

(2)选择服务器:CPU建议不要少于2 * Quad-core并且激活HT(Hyper-Threading);为每个计算内核配置至少4G内存,并且预留6%的内存为虚拟化的有效运行。Hadoop性能对I/O很敏感,建议每台服务器配置多块本地存储而不建议配置少块大容量的硬盘。考虑任务调度的代价,对于每个计算内核不建议配置超过2块本地存储。为高性能考虑,推荐使用10G网卡。考虑为主节点服务器(运行namenode、Jobtracker)配置双电源以提高可靠性。

(3)虚拟化配置:本地存储尽量避免配置成RAID,为每一个物理盘创建一个datastore虚拟化网络配置时为了可靠性和网络传输效率,隔离管理网络和Hadoop集群网络。如图4所示:


154628452.png

图4:虚拟化网络配置


(4)系统设置:BDE将会自动配置根据实验经验取得的虚拟磁盘和操作系统参数,向用户屏蔽性能优化的具体细节。建议对性能敏感的用户替换默认模板采用CentOS6*,因为Linux 6.* 内核的THP(TransparentHuge Page)和EPT(Extended PageTables,Intel处理器)可以一起帮助虚拟化性能。

(5)Hadoop配置: BDE将会自动产生并配置hadoop配置文件(主要在map-site.xml,core-site.xml,和 hdfs-site.xml内),包括块大小(blocksize),会话管理和日志功能。但是有一些相关于MapReduce任务的参数,包括mapred.reduce.parallel.copies,io.sort.mb,io.sort.factor,io.sort.record.percent,和tasktracker.http.thread,需要根据不同负载具体设置。

(5)扩展建议:如果用户观察集群中CPU的利用率经常超过80%,建议加入新的节点。另外单个存贮节点的容量不建议超过24TB,否则一旦节点失败,数据备份拷贝容易造成数据拥塞。扩展可以按照小规模集群上运行性能基准经验和资源使用情况进行。


  如有任何问题,您可以发邮件至bigdata_apac@vmware.com。


  关于vSphere Big Data Extensions:


  VMware vSphere Big Data Extensions(简称BDE)基于vSphere平台支持大数据和Hadoop作业。BDE以开源Serengeti项目为基础,为企业级用户提供一系列整合的管理工具,通过在vSphere上虚拟化Hadoop,帮助用户在基础设施上实现灵活、弹性、安全和快捷的大数据部署、运行和管理工作。了解更多关于VMware vSphere Big Data Extensions的信息,请参见http://www.vmware.com/hadoop。


作者简介

154834465.jpg

李欣慧

VMware软件高级工程师

现担任VMware大数据部门高级工程师,致力于大数据在云计算中心上的服务化和高效化,工作在分布式系统性能优化领域。李欣慧毕业于中科院计算所,后加入IBM实验室-分布式计算部,主要工作在云计算和并行数据处理领域,为大规模数据中心提供最优监控和运维工业解决方案。有9项专利在美国和中国注册,在国际知名会议、学术期刊上发表论文5篇。

原文链接:http://vbigdata.blog.51cto.com/7526470/1298757


酷毙

雷人

鲜花

鸡蛋

漂亮
  • 快毕业了,没工作经验,
    找份工作好难啊?
    赶紧去人才芯片公司磨练吧!!

最新评论

关于LUPA|人才芯片工程|人才招聘|LUPA认证|LUPA教育|LUPA开源社区 ( 浙B2-20090187 浙公网安备 33010602006705号   

返回顶部