设为首页收藏本站

LUPA开源社区

 找回密码
 注册
文章 帖子 博客

8核心龙芯3B全解析:性能超越i7-980X?

2011-5-8 19:41| 发布者: joejoe0332| 查看: 33891| 评论: 8|原作者: donews|来自: donews

摘要:   5月6日在近日上海大学举行的《2011龙芯与开源社区发展论坛上海站》活动中,曝光了龙芯最新产品龙芯3A、3B的最新情况。其实在不久前在斯坦福大学举行的Hot Chips大会上,中国龙芯首席架构师胡伟武展示了最新的三 ...
  5月6日 在近日上海大学举行的《2011龙芯与开源社区发展论坛上海站》活动中,曝光了龙芯最新产品龙芯3A、3B的最新情况。其实在不久前在斯坦福大学举行的Hot Chips大会上,中国龙芯首席架构师胡伟武展示了最新的三款芯片的设计,其中一款芯片将可能用于构造超级计算机TOP500级别的国产超级计算机。

国产龙芯3B 1G主频性能远超Intel i7

    继龙芯3A后,龙芯3号系列处理器的第二代产品——8核龙芯3B处理器已于今年年初流片成功,最新的设计包括主频1GHz的8核处理器龙芯3B和主频未知的16核处理器龙芯3C,以及用于上网本等移动设备的低功耗单核处理器龙芯2H。龙芯3B/2H将于2011商业化,3C则要等到2012之后。目前公司相关部门正在对该款芯片做进一步的开发和测试工作。预计今年夏天实现量产。 

    龙芯3B采用了65纳米生产工艺,在单个芯片上集成8个增强型龙芯GS464处理器核,它可以与MIPS64兼容,并支持X86虚拟机和向量扩展。在1GHz主频下可实现128Gflops的运算能力。在存储设计方面,龙芯3B最多可同时处理64个访问请求,可提供12.8GB/s的访存带宽。在I/O接口方面,龙芯3B实现2个16位的HyperTransport接口,可提供高达12.8GB/s的IO吞吐能力。八核龙芯3号的芯片对外接口与四核龙芯3号完全一致,两款芯片引脚完全兼容,可实现无缝更换。

    作为国家“核高基”重大专项的主要研发成果之一,未来,龙芯3B将主要应用于高性能计算机、高性能服务器、大型超算中心等领域。为制造出我国全国产的大型计算设备提供过硬的核心动力。 

  龙芯3B仅1GHz主频就超越i7-980X

  芯提供的资料显示。龙芯3号是面向高吞吐率计算和高性能计算,降低成本和功耗的需要而设计的多核芯片。龙芯3A 4核处理器是功耗最低的多核服务器芯片。

国产龙芯3B 1G主频性能远超Intel i7

4核心龙芯3A架构图

    龙芯3号系列产品规格:

    龙芯3A(4核CPU):
    65nm工艺,集成4个1GHz的GS464处理器核心
    主频1GHz,功耗小于15W,共享的4MB二级cache
    集成2个DDR2/3控制器,2个HT控制器
    集成 PCIX/PCI,LPC、UART、SPI、GPIO接口
    4.25亿个晶体管,面积173mm2
    双精度浮点运算速度16GFLOPS
    功耗最低的多核服务器芯片,高带宽设计,高可靠性设计,良好的可扩展性,支持四个处理器的无缝互连
    可应用于通用服务器、云计算服务器、云存储服务器、高性能桌面等

    龙芯3B(8核CPU):
    1GHz 65nm
    片内集成8个GS464处理器核心,每个核256位向量扩展
    双精度浮点运算速度128GFLOPS,为龙芯3A计算能力的8倍
    8核共享的4MB RAM/Cache
    2个64位400MHz的DDR2/3控制器
    2个16位800MHz的HyperTransport控制器
    6亿个晶体管,面积300mm2
    功耗:40W
    应用于高性能计算等
    2010年11月样片,2011年6月产品

    龙芯3C(16核CPU):
    主频:1.5GHz 28nm LP
    2011年流片

  Hot Chips大会上胡伟武报告的最大惊喜是如果计算所现在的下家ST半导体无法在2011年达到28nm工艺的话,3C将由台湾半导体制造公司生产。由于历史原因,大陆和台湾的政治关系一向紧张,即使在双方经济依赖程度增强的情况下也是如此。

国产龙芯3B 1G主频性能远超Intel i7

   Intel芯片的高性能相比,龙芯3号更重视性能功耗比这个指标的先进性。而能够充分体现出这个特色的是最新的龙芯3B芯片。在其提供的性能对比表里。龙芯3B的双精度峰值达到128GFLOPS为龙芯3A计算能力的8倍,超过了Intel Core i7 980 XE。尽管还落后AMD Opteron X12但是龙3B的功耗只有40瓦,不过性能功耗比达到了3.2,是对比产品中最好的。

  移植Android:针对低功耗和嵌入式

  重要的事实是龙芯正在积极的把Android操作系统(Google推出的智能手机操作系统)移植到MIPS指令集上来,并且计算所的工程师在这个工程上非常活跃。来自微软的工程师Swift说,“中国对于Android的推动是显著的,在很多方面都处于领先,别的方面也都在步步跟随。”

  在龙芯低端系列上,Halfhill表示龙芯2H和之前的芯片相比是一个功能改进版。胡伟武说2H芯片主要用于上网本等移动设备,以及低功耗PC和嵌入式设备。

国产龙芯3B 1G主频性能远超Intel i7

龙芯移动设备

国产龙芯3B 1G主频性能远超Intel i7

  4个USB2.0、麦克风、耳机、线性输出插口;红外IO窗口,以及一组指示灯和复位、电源开关。

  龙芯基于MIPS指令集,属于精简的指令集。Intel和AMD基于x86指令集,属于复杂指令集。中国计算技术研究所(ICT)在MIPS指令集的基础上给最新的芯片添加了超过300条指令,主要是在图形学和科学计算领域常用的向量处理功能。曙光6000挤进TOP500也将是2004年之后基于MIPS系列芯片的超级计算机出现在TOP500中。

  龙芯的发展对于从斯坦福出来的MIPS公司是一个好消息,这个公司授权MIPS指令集专利,并与x86、ARM、PPC竞争。“我们认为正是中国政府主导的国产芯片的努力使得ICT和MIPS指令集可以达到领先地位。”,MIPS市场营销副总裁Art Swift表示。

  上海Android社区的发起人上海锐极电子科技的李道流介绍了上海Android社区的建设情况和发展构想。最后的上海大学胡瀚森同学代表社区做了上海大学开源社区的建设情况的介绍。全部演讲结束后,本次活动的主要策划方龙芯俱乐部的石南感谢龙芯梦兰公司和各个社区的大力支持,并提出了建设龙芯硬件开源项目的构想。

  开源助力龙芯 周边产品开发

  在首届“龙芯杯”中科院全国开源大赛的优秀参赛作品《ArchLinux龙芯版》的移植者王锐做了作品的介绍和演示。具了解ArchLinux是一种以轻量简洁为设计理念的Linux发行版。其开发团队秉承简洁、优雅、正确和代码最小化的设计宗旨。Arc Linux项目受CRUX启发,由Judd Vinet于2002年启动。王锐向大家介绍了为什么要移植ARC到龙芯平台、移植的主要过程、目前移植的状况和未来的发展,并回答了大家的提问。

国产龙芯3B 1G主频性能远超Intel i7

  另外一款参赛作品《RT-Thread 龙芯版》是一款国内知名的原创性实时操作系统。诞生于2006年,由全国各地近30名开发人员的本土化开源社区开发、维护。RT-Thread具有高效稳定的实时内核、开放源代码。已经运用在超高频RFID阅读器、电视台发射台等商业产品上,外国采用RT-Thread的打印机解决方案已经出货80万台,其发展潜力非常巨大。在活动现场RT-Thread代表邱祎在基于龙芯1 号内核的3210 SOC开发板上运行RT-Thread系统,演示了其游戏模拟器上的超级玛丽游戏。目前RT-Thread计划支持最新的龙芯1A SOC芯片,并移植RT-Thread的外围组件。 

  此外《中尺度气象模式MM5在龙芯机子上的应用》还成功移植了NCARG/NCL绘图软件,并用该软件显示设置的MM5模式模拟区域。下一步计划在龙芯3A平台上尝试运行全球尺度的地球系统模式,地球系统模式是当前气候预估重要的模式工具,也是高性能科学计算的重要领域;以及在龙芯3A平台上尝试运行气象-排放-污染输送的空气质量模式系统,拓展龙芯产品在气象、环境科学计算领域应用。

国产龙芯3B 1G主频性能远超Intel i7

  来自中标软件高级技术经理何曌君向大家介绍了中标软件对于龙芯开发社区的展望,并给大家带来了振奋人心的消息。一个是已经在2011年4月12日发布了O32下fedora13 Beta龙芯版本。第二个是提到建立名为Koje的基于龙芯2f、龙芯3A的龙芯在线自动化编译平台社区,通过WEB平台对龙芯开发者开放使用。这个是众多龙芯开发者非常需要的一个开发平台,得到了大家的高度评价。

  开源力量创始人程旭文做了《开源社区,生生不息的乐土》的主题演讲据其统计的中国开源项目数量有1000个之多,企业的开源项目有50-100个。而中国开源社区存在着人数多,基数大的特点,有部分优秀开源作品但存在稳定性和持续性不足的问题。如能提高参与者合作意识,对开源项目加以引导得当将会产生巨大的经济效益和社会效益。对于开源项目普遍遇到的缺乏资金支持的问题,着重介绍了其发起的息壤开源基金的构想和已经在争取共创软件联盟等机构提供启动基金的情况。计划将开源的公益性剥离出来,成立公益的开业基金会—息壤开源基金。为一些有发展潜力的开源项目提供孵化的服务。目前已经确定吸收RT-thread实时操作系统、SemoCompiler编译器、MYCP应用服务器、EnerpriseConnect、ZentaoPM项目管理、Ralasafe云安全、EasyJWeb Java框架、JDonFramework java框架、MaricmsCMS等十大项目作为基金会的发起项目。息壤开源基金会网站sarons.org现在已经可以访问。

  开源硬件推动者李大维做了国外流行的《开源硬件》开源活动的介绍:如开源的无人机、电话、手机、相机、3D打印机等。拓展了大家的思路,充实了对开源的理解。同时也给龙芯开源社区的发展提供了一个发展方向。

  开源项目管理软件《禅道》的创始人王春生介绍一年来禅道已经有1300多个企业使用者,活跃用户在100个左右。与培训机构进行了合作,并组建了专门的开发团队。计划在龙芯俱乐部和中部软件合作的龙芯3A社区平台上进行发布。

  龙芯发展现状及未来

  虽然8核的3B处理器取得了不错的成绩,不过与Intel Sandy Bridge和即将推出AMD Bulldozer芯片相比,无论性能和工艺都有很大的差距,无疑将拉大美国芯片设计业和中国龙芯CPU的设计水平。

  然而,中国的芯片制造能力正在快速发展。Xeon处理器使用的是32纳米工艺,而龙芯3B使用的是65纳米工艺,这是导致龙芯3B速度不行的原因之一。(65纳米工艺落后了32纳米工艺两代)而龙芯3C处理器将跳跃性的使用28纳米工艺,估计这将使得龙芯有两倍的速度提升。加上比3B多出来8个核,龙芯3C有可能比3B快四倍以上。

国产龙芯3B 1G主频性能远超Intel i7

  胡伟武过去强调过计算所研发“国产芯”的主要目标是生产出来用的起的芯片,推动中国从工业时代迈入信息时代。 

  龙芯系列不得不面多一个挑战是要在性能上和别的架构竞争。

  龙芯处理器芯片似乎主要是用自动化的电路设计工具设计的,这是微处理器工业的惯例。但是似乎没有经过工程师手工的优化调整。这暗示着在处理器中可能会有一些瓶颈存在。“我一直搞不懂”,Halfhill说,“中国看起来从来不缺乏电路设计人员。”

  Swift说:“我觉得他们真正追求的是广泛使用并能够打破Intel垄断的国产芯片。”

  打破Intel的垄断并不表示要打破Windows的垄断。虽然计算所(ICT)在Android等开源软件领域和活跃,龙芯系列芯片也包含了很多指令,用于提高x86指令的模拟速度。微软的工程师参加了Hot Chips胡伟武的报告。Swift说:“我不排除或许什么时候龙芯上可以跑Windows。”(目前龙芯无法运行windows)


酷毙

雷人
2

鲜花

鸡蛋

漂亮

刚表态过的朋友 (2 人)

相关阅读

  • 快毕业了,没工作经验,
    找份工作好难啊?
    赶紧去人才芯片公司磨练吧!!

最新评论

关于LUPA|人才芯片工程|人才招聘|LUPA认证|LUPA教育|LUPA开源社区 ( 浙B2-20090187 浙公网安备 33010602006705号   

返回顶部