今天温哥华的天气非常的舒适,暖洋洋的阳光,新鲜的海风的味道,为整个Apache Big Data 2016开幕带来了不错的气氛。这是Apache 官方举办的大数据峰会,由来自世界各地各个大数据相关项目的贡献者,用户等分享他们的实践及经验。 今天的开幕式由Apache软件基金会(ASF)的执行副总裁Rich Bowen支持并开场,介绍了参会者、赞助者等的情况。 Keynote第一场Keynote由Netflix介绍他们如何使用大数据生态系统来构建和完善他们的产品、分析及用户体验。 下图是著名的China and The remain of the World, Netflix将Dvd变成视频这个业务已经开展到全世界了,除了中国等“其他”国家... 下图是他们的数据统计信息,值得一提的是他们的流量占了美国全国流量的1/3,相当的震撼,这也间接说明了云对他们的全球部署是多么的重要。 第二场来自IBM,说了一通就一个主题:IBM 全扑在Spark上了,介绍了收购的天气公司中处理数据的流程等: 展会现场赞助商的展台在休息时间总是各种人,一张Poster一张桌子就开始摆摊了,今年IBM的展台最大,又全面介绍Spark...有几个Startup的东西蛮有意思,包括一家做数据隐私的创业公司,提供这方面的服务,可惜这个在国内估计很难落地。 Apache Kylin的演讲在Keynote之后,同时有多个专题演讲开始,本人做了“The Evolution of Apache Kylin"的演讲,详细介绍了Kylin新版本中的体系架构的变化、并行Scan,TopN等各种新的Feature,最后介绍了后续的Roadmap等,会后被问了一堆问题,很多人关心在性能及Kylin如何与Hadoop集群交互等方面。 在演讲中,这个slide最吸引参会者,这么多来自中国的案例及相关数据规模、使用情况等,很是吸引人: 这次大会有来自很多项目的演讲,介绍项目的,架构的,使用等等,不一一列举,大家有兴趣可以点“阅读原文”参考感兴趣的话题,相关的PPT应该也都可以下载。 参会感想与会的中国参会者相对比较少,只碰到了来自Intel上海的几位朋友,演讲就我们一个。现场听下来,很多Topic都比较初级,深信如果国内的案例、项目等拿出来现场讲的话会有非常多有兴趣的人来听,特别是提到面临的数据挑战、解决方案、数据规模等等。推荐各位朋友积极提交各种议题,更多的宣传下大数据的未来所在国家的技术实力; 志愿者本次参会中本人也成为志愿者一员协助一些工作,在昨天晚上的准备工作中认识了很多来自各个国家的新朋友,包括美国,法国,中国,韩国,印度,巴西,澳大利亚等等,各种讨论,玩笑,八卦,深刻感受社区的Diversity! 下图是志愿者正在分配相关工作: 之后大家去了一个不错的Pub喝酒聊天,最重要的是听八卦...各种吐槽和玩笑,据说David被选为Infr VP是被坑上去的,就是照片中右侧的家伙(ASF执行副总裁)坑他的,不过最近他加入了Linux Foundation作为全职员工...细问之下,每个Apache项目每年至少花掉几千至几万美元的INFR相关的成本,那么问题来了,如何保证新加入的项目上是健康、长久和活跃的?是否应该拒绝项目加入呢?如何治理孵化器项目呢?争论永在,唯有实践! 关于韩卿 (Luke Han)韩卿 (Luke Han) —— Kyligence联合创始人兼CEO,Apache Kylin联合创建者及项目委员会主席,首个来自国内的Apache软件基金会顶级项目副总裁,负责Kylin的战略规划,发展路线图及产品设计等,并致力于发展Apache Kylin全球社区,构建生态系统及推广等。曾任eBay全球分析基础架构部大数据产品负责人,Actuate中国首席顾问,卓越动力华东区技术总监等职,在大数据,数据仓库,商业智能,可视化情报分析等领域拥有丰富的经验。 |