AlphaGo Zero横空出世，无师自通完爆阿法狗

2017-10-19 22:49| 发布者: joejoe0332| 查看: 1725| 评论: 0|原作者: oschina|来自: oschina

摘要: 今年 5 月的人机对局中，柯洁 9 段以 0:3 不敌 AlphaGo，随后 Deepmind 在围棋上进一步探索。Nature 今天的论文就详细介绍了谷歌 DeepMind 团队最新的研究成果。阿法狗战胜人类，其棋艺的精进是建立在计算机对海量历 ...

今年 5 月的人机对局中，柯洁 9 段以 0:3 不敌 AlphaGo，随后 Deepmind 在围棋上进一步探索。Nature 今天的论文就详细介绍了谷歌 DeepMind 团队最新的研究成果。

阿法狗战胜人类，其棋艺的精进是建立在计算机对海量历史棋谱学习参悟的基础之上，实现自我进化和超越。

而新一代的阿法元（AlphaGo Zero）完全是从零开始，不需要任何历史和人类的指导，通过全新的强化学习方式自己成为自己的老师，在棋艺上不仅达到了超越人类的精通程度，也打败了它的师兄阿法狗（AlphaGo）。

达到这样一个水准，阿法元只需要在4个TPU上，花三天时间，自己左右互搏490万棋局。而它的师兄阿法狗，需要在48个TPU上，花几个月的时间，学习三千万棋局，才打败人类。

美国杜克大学人工智能专家陈怡然教授在接受知社采访了时，说到：这恰好证明了人类经验由于样本空间大小的限制，往往都收敛于局部最优而不自知（或无法发现），而机器学习可以突破这个限制。之前大家隐隐约约觉得应该如此，而现在是铁的量化事实摆在面前！

虽然这一技术还处于早期阶段，但阿法元（AlphaGo Zero）的突破使得我们在未来面对人类面对的一些重大挑战时充满信心（如能源问题）。

人工智能到底将何去何从？如果将该技术应用到其他问题上，会对我们的生活产生哪些根本性的影响呢？

上一篇：与ESET合作，Chrome浏览器也能提供安全防护能力下一篇：VirtualBox 5.2正式版发布：可导出虚拟主机至OPC云端

帐号		自动登录	找回密码
密码			注册

最新评论