能做什么: 利用数据流或者脚本类语言进行数据处理。 有何帮助: 帮助程序员利用数据流语言发挥MapReduce功能。 能做什么: 利用预先编写的库在MapReduce中运行机器学习算法。 有何帮助: 允许用户通过库创建MapReduce建议与集群。利用现有代码加快开发速度。 能做什么: 利用预先编写的库在MapReduce中运行图形算法。 有何帮助: 用户不必再为了使用MapReduce而重新编写图形算法。利用现有代码加快开发速度。 能做什么: 运行测试以验证MapReduce工作功能的正确性。 有何帮助: 运行程序测试以验证MapReduce程序运作的正确性。提供对象,允许用户模拟输入流程以验证执行结果。 能做什么: 提供简便方式以实现MapReduce工作数据的输入与输出。 有何帮助: 创建域对象以存储数据。简化MapReduce工作数据的序列化与反序列化。 能做什么: 在关系型数据库与Hadoop之间实现数据移动。 有何帮助:允许数据从关系型数据库转移到Hadoop当中,以备后期处理。将数据输出结果从MapReduce工作中提取出来并移回关系型数据库。 能做什么: 以可扩展方式处理大量日志数据。 有何帮助: 将大量日志数据转移到HDFS当中。由于Flume拥有的扩展性,因此能够处理大量传入数据。 能做什么: 允许用户通过网络浏览器与Hadoop集群进行交互。 有何帮助: 用户能够更轻松地与Hadoop集群实现交互。细化权限设定帮助管理员对用户进行配置。 能做什么: Hadoop中的复杂工作流的创建任务更加便捷。 有何帮助: 允许用户利用Hive、pig以及MapReduce等其它项目创建复杂工作流。内置逻辑允许用户按预定步骤处理故障。 英文原文:http://www.networkworld.com/slideshow/124977/sizing-up-the-hadoop-ecosystem.html#slide1 |