记者:Yahoo很多的应用,但是针对每个应用就相当于一个很大的网站,一个公司可能正在做这方面,比如财经方面,如果Yahoo不花 那么大力气去开发这些了,那Yahoo就可以做更好了,那么其他公司都利用Hadoop一下子就做得很大了,那你帮助了那么多人,是不是就为Yahoo树 立了很多竞争对手了呢? Todd Papaioannou: 这是开源软件的特点,整个工业界的发展需要有人出来贡献点什么,Hadoop开源出来会鼓励更多的开发者出来。那么对于Yahoo的好处,目前就有30% 的人参与进来。随着开源就会有更多的Hadoop人才出来,包括清华也有很多人在叫Hadoop,Hadoop对于Yahoo而言是一个双赢的事。 记者:Hadoop更多的是在运营管理中的贡献,那么在实施过程中的,实施方面的开源是不是也是一个发展方向? Todd Papaioannou:对于开源软件来说其实是更容易实现的,因为他是开发的。Yahoo所关注的贡献并不仅仅是 Hadoop在运营上的,而是在一个数据中心上的范畴上,整个数据中心不仅仅有Hadoop,还有其他的工作,包括数据库、以及前端服务。Yahoo把这 一系列看做一个整体,希望在这个整体上能够提供完整的服务。 记者: 据了解Google是最早使用MapReduce,为什么Google不用Hadoop? Todd Papaioannou: MapReduce不是Google独有的技术,实际上MapReduce是一种方法或者是一种思想方式,mapreduce的出现远远早于Google 对它的应用,实际上Mapreduce还有很多其他的应用实现。而Hadoop就是其中之一,还有其他公司也有MapReduce的应用。目前而 Hadoop是MapReduce应用上最成功也是最开放的一个方面,很多人对于MapReduce是属于Google的其实是一个误解,据我所知 MapReduce至少出现20年了。Google有自己对MapReduce的实现方式,而Yahoo也有自己的方式来实现MapReduce。其中 Hadoop就是MapReduce最成功的一个实现,这也是为什么目前Hadoop这么知名的原因。 |