Apache 软件基金会宣布 Apache Impala 孵化成功,升级为顶级项目。 Impala 是一个高性能分析数据库,可针对存储在 Apache Hadoop 集群中的 PB 级数据进行闪电般快速的分布式 SQL 查询。Impala 还是一个现代化,大规模分布式,大规模并行的 C ++ 查询引擎,可以分析,转换和合并来自各种数据源的数据。大规模并行处理(MPP) SQL 查询引擎允许通过 SQL 或商业智能工具对存储在本地(在 HDFS 或 Apache Kudu 中)或在云对象存储中存储的数据进行分析查询,而无需将数据集迁移到专用系统或专有格式。 Impala 提供:
Impala 的灵感来自 Google 将查询处理与存储管理分离开来的 F1 数据库,最初于2012年发布,并于2015年12月进入 Apache 孵化。 Impala 项目创始人 Marcel Kornacker 表示:“2011年,我们开始开发 Impala ,以便为用户提供最先进的开源 SQL 分析。 Apache 顶级项目的毕业典礼是对这个项目背后的优秀开发者社区的肯定。” |