2014年1月18日,由@百度主办、@InfoQ负责策划组织和实施的第46期百度技术沙龙活动上,百度深度学习研究院(IDL)主任研发架构师/高级科学家黄畅博士、清华大学电子工程系副教授,智能技术与系统国家重点实验室副主任刘长松教授,各自分享了其在识图领域的经验和技术。他们的话题涉及“开启读图时代”和“读图技术和应用”这两个方面,本文将对讲师各自的分享做简单的回顾,同时提供相关资料的下载。 主题一:开启读图时代(下载讲稿)
黄畅博士介绍了大量的Deep Learning的理念和应用,通过百度深度学习研究院的大量有趣的识图产品,揭晓了读图时代的到来。其演讲内容主要包括:识图技术的进展、识图技术在百度IDL、识图技术应用的未来。
识图技术的进展
识图技术在百度IDL
识图技术应用的未来
黄畅博士从Deep Learning的理念开始讲起,逐步深入到了百度深度学习研究院的各种技术,包括:相同图像搜索、相似图像搜索(人脸、美女、一般图像)、图像知识图谱(花卉)。
“相比2005年人们翘首以盼迎接新年的方式,在2013年,手机、pad成为人们记录生活的重要手段,这个时代已是读图时代。”黄畅博士总结道。
刘长松教授介绍了了大量的文字识别、图像识别、人脸识别的技术和应用实例。根据不同的对象,及复杂的应用场景,深入浅出的介绍了图像识别的逻辑、模型和算法,并阐述了传统方法与深度学习的差异。
主要挑战和难点问题
图像识别的几点思考
“由于切分错误的存在,尽管单字识别可以达到94-99%的,地址识别达到89%,自由书写的普通手写字符串的识别率汉字仍低于50%,英文单词识别率10-20%。文字识别寻找一份最优切分路径的方法。”刘长松教授讲解到。
人脸识别的难点
为了促进参会者与我们每期的嘉宾以及讲师近距离交流,深入探讨在演讲过程中的疑问,本次活动依然设置了Open Space(开放式讨论)环节。在Open Space的总结环节,几位话题小组长分别对讨论的内容进行了总结。
会后,一些参会者也通过新浪微博分享了他们的参会感受:
有关百度技术沙龙的更多信息,可以通过新浪微博关注@百度技术沙龙,或者关注InfoQ官方微信:infoqchina,InfoQ上也总结了过往42期所有百度技术沙龙的演讲视频和资料等,感兴趣的读者可以直接浏览内容。 |