起调压下了场下的细声讨论,继续他的讲述——
“60年前,总部位于伦敦的deepd是科技巨头谷哥收购的早期人工智能公司之一。那一年,是2015年,deepd的研究人员在《科学》杂志上发表了一篇文章,描述了他们如何教人工智能程序玩20世纪80年代的街机电子游戏,比如“videopball电子弹珠台”。他们教它学习玩游戏的方法,而不是具体游戏的玩法,二者有着根本的区别。他们只是打开基于云端的人工智能,放手让它去玩雅达利公司那些古老的游戏,例如breakout,这是一个左右移动光标让弹球可以持续不掉落,持续打方块的游戏。正如你们已经知道的那样,它会学着如何不断的提高分数,而且进步飞速。起初,人工智能几乎是在随机地玩,半个小时后,每四次操作,它才失误一次。一个小时后,他在300局游戏中做到了零失误。之后,它继续飞快的学习,以至于在第二个小时里,它算出了breakout中的一个漏洞,而此前数百万人类玩家都没有发现。利用这个漏洞,它可以通过打通一面墙赢的游戏,这连游戏开发者也没有想到。在没有deepd开发者指导的情况下,一种叫做“深度强化机器学习”的算法在接触了四十九个雅达利游戏数小时