BigQuery是Google推出的一款SaaS查询产品,其发展势头似乎越来越好。它允许查询云中的大型柱状数据结构。开发人员可以通过上传到Google云存储(相当于Amazon的S3)或者以流数据的方式把数据加载到BigQuery中,然后使用类似SQL的查询语言执行OLAP风格的查询。
现在,越来越多的从业者分享了他们的BigQuery实践经验。例如,Shine Technologies的Graham Polley在报告中写道:
我们决定自己进行测试,使用一个15亿行的数据集向BQ发起挑战。事情即将变得非常有趣——BigQuery真能像Google的宣传口号所说的那
样“能够对数十亿行的大规模数据集进行交互式分析”吗?印象深刻,它能。确切地说,印象非常深刻。即使不使用缓存结果(缓存结果可以开启和关闭),使用相
对复杂的查询在一个15亿行的大规模数据集中汇总数据,在20到25秒的时间里,我们就能获得一致的结果。
BigQuery可以单独使用,也提供与其它服务的集成,如Google Apps脚本或Google分析。关于后者,Jonathan Weber(来自LunaMetrics的数据传教士)写过一篇内容丰富的文章,其中他写道:
首先,BigQuery导出功能只对Google分析付费版客户可用。他们可以通过付费版账户管理器启用BigQuery导出功能。请注意,在
BigQuery中,数据存储和处理都是收费的,但Google分析付费版用户可以使用每月500美元的信用额度来支付那些费用。在许多情况下,那500
美元都会发挥很大作用。作为参考,我看了我们其中一位使用BigQuery的付费版客户。他们的网站每月大约有600万的访问量和5000万的综合浏览
量。数据从九月份开始导出,本月他们的数据存储费用大约为12.86美元。
虽然BigQuery只是一个基于云的解决方案,但支撑BigQuery(Dremel)的底层技术是许多像Apache Drill或Impala那样的开源SQL-in-Hadoop解决方案的核心。
查看英文原文:Google's BigQuery Gaining Momentum
转自 http://www.infoq.com/cn/news/2014/02/bigquery-gaining-momentum?utm_campaign=infoq_content&utm_source=infoq&utm_medium=feed&utm_term=global |