关于人工智能:DeepMind爆发史决定AI高峰的游戏玩家|深度学习崛起十年

46次阅读

共计 17332 个字符,预计需要花费 44 分钟才能阅读完成。

翻译|刘晓祯、沈佳丽、胡燕君、许晨阳、周亚坤

很少有人会否定,过来十年,AI 畛域最夺目的明星组织当属 DeepMind,没有之一。

那个触动世界的高光时刻产生在 2016 年 3 月的一天,AI 选手 AlphaGo 击败了世界围棋冠军李世石的那一刻,全世界更宽泛的群体意识到了 AI 的威力,并成为将 AI 技术推向新一轮顶峰的闪亮标记,也是受到这一刻的感召,科技界很多人涌入 AI 守业火线,由此掀起 AI 利用的低潮。这一战,也让 AlphaGo 的缔造者——DeepMind 和它的掌门人 Demis Hassabis——走到了舞台地方。

Demis Hassabis 出生于 20 世纪 70 年代的伦敦北部。13 岁时,他就曾经在国际象棋较量的中锋芒毕露,在同年龄组别里排名第二。16 岁时,他设计出了风行一时的“主题公园”游戏。本科时,他在剑桥大学修读计算机科学和数学,经验简短的开办电子游戏公司并将其卖掉之后,他又去了伦敦大学学院(UCL)的神经科学畛域读博深造,随后通过策略性地“画大饼”,取得了一位美国亿万富翁的天使投资,最终,他与另外两位联结创始人 Shane Legg 和 Mustafa Suleyman 在 2010 年独特创建了 DeepMind。

国际象棋、游戏、计算机科学、神经科学和 AI,这些畛域并不是毫无关联,它们最终构建了一张 Demis 梦寐以求的蓝图:通用人工智能(AGI)。

要想实现这一看似仅存于理念层面的指标绝非易事。在 Demis 看来,他首先是一名科学家,而后才是一名企业家,这是他实现目标的正确路径。当初,如果他能在学术界有机会实现 AGI 的指标,就会呆在那儿,但在学术界的限度下,这些不可能产生。实际上,须要大量烧钱的研究型企业 DeepMind 也无奈独善其身。在运作近四年后,2014 年,Demis 将 DeepMind 卖给了 Google,背靠金主,他就能放慢实现迷信倒退的使命。

事实证明,美国亿万富翁和 Google 的眼光不错。在迈向 AGI 的路上,DeepMind 先声夺人,从 AlphaGo 开始,接连推出 AlphaZero、AlphaFold、AlphaCode 这些 AI 畛域的扛鼎之作,并且将技术成绩都发表在《Nature》和《Science》等顶级期刊上。用惯例学术规范掂量,他们曾经用科研成果证实了本人的实力,这些顶级论文在过来几年里的被引次数都排名世界前列,而且他们的想法失去了业内宽泛关注和追捧。

公开论文无疑会给 DeepMind 引入更多竞争者,但在 Demis 看来,如果所有人都能公开分享本人的想法,整个行业的倒退速度会比闭门造车快得多。最重要的是,比他人放弃更快的翻新节奏,在公开一个翻新想法后,还要有一两个能够延长的翻新想法。“面对竞争对手,放弃翻新节奏就是最好的自我爱护。” 继续输入重磅原创性技术,让 DeepMind 在 AI 畛域成为妇孺皆知的灯塔式的存在。

Demis 自己尽管身处幕后,但从一个游戏玩家成为 AI 畛域的革新者,他的成就令人可望不可即。他长于讲故事,为人亲和,但在平实的话语中会让你感触到这是一个雄心勃勃的人。

在中文社区,对于 DeepMind 和 Demis Hassabis 背地的平凡的守业故事系统不全。这次,OneFlow 社区整顿编辑了 Demis Hassabis 的最新公开演讲和官网播客,以他集体的第一视角自述 DeepMind 的过来、当初和将来,齐备地出现了那些大胆的组合式翻新想法、远大的集体野心,冒险的勇气、必胜的信念以及即使失败也反对翻新摸索的环境。通过他的讲述,由此咱们能够正视中国在 AI 翻新守业畛域的真正差距。

1

“过后就决定把职业生涯献给 AI”

家喻户晓,人工智能是一门让机器智能化、变聪慧的迷信。我的 AI 之旅始于游戏,它在我的生存中始终是个很重要的角色,当初,游戏作为 DeepMind 钻研我的项目的一部分,依然很重要。

4 岁时,我就开始下棋,并且始终十分认真地负责英格兰少年象棋队的队长。那时,我的幻想是成为国际象棋的世界冠军。如果你想进步国际象棋程度,该怎么做?看相干书籍,钻研大师级的较量,这实际上是晋升下棋时的思维过程,在致力改良决策。

我的很多思维形式都是通过国际象棋倒退的,比方打算、解决问题的思维等能力。无论未来从事什么职业,这些能力都很实用。

我小的时候十分喜爱反思。对于一个常常反思的孩子,这时的我实际上曾经开始反思“思考”这件事自身了,思考大脑如何冒出这些想法和打算,如何决定走哪步棋以及这背地的过程到底是怎么的?我着迷于人脑的思维和智力。

八九岁的时候,我用国际象棋较量的奖金买了第一台电脑,那台电脑的名字叫做 ZX Spectrum,在 80 年代中期的英国十分风行。也是在这时,我踏入了编程大门,买了一些编程书籍,开始编小游戏,批改一些小游戏代码。

很快,我就爱上了电脑和编程,并意识到电脑的神奇之处。作为人类,咱们自身就像是制作机器或工具的猴子,但计算机作为一种通用机器有其非凡之处。

大多数机器只是扩大了咱们的身材能力,比方, 汽车让人类的速度跑得更快,飞机让人类能够在地面航行,但电脑却是人脑思维的延长,能做的事件也更多。

我是在开始编写人工智能程序、应用计算机进行科学计算时,才意识到这一点。直到现在,我还感觉这很神奇,因为利用电脑加一个早晨的工夫就把问题解决掉,期间还能够间接去劳动让电脑本人工作。

我喜爱电脑和游戏,自然而然,就开始写一些商业的视频游戏。90 年代中期,17 岁的我写的最有名游戏应该是“主题公园(Theme Park)”。基本上,我在游戏生涯中写的所有游戏都是基于人工智能的,这个游戏也是如此。

“主题公园”的玩法是构建玩家本人的迪士尼乐园。游戏开始时,你会拿到一块空地和一些启动资金,而后就能够开始布局、建造主题公园。实现之后,如果对本人的设计很称心,能够凋谢主题公园,吸引成千上万的小人儿买票进入。这些小人儿会基于内置的 AI 零碎来判断你的主题公园是否设计得够好。如果他们玩得很开心,你还能够向他们卖汉堡、可乐和商店里的气球,这背地其实有个经济模型。

某种程度上,其实是进入主题公园的小人儿背地的 AI 零碎在评判你的主题公园设计的好不好,这就造成了一个反馈闭环,由此你能够赚更多钱,建更多好玩的游乐设施,让主题公园越来越好。

“主题公园”在寰球售出了近 400 万份。那时,另一个比拟有名的治理模仿类游戏叫“模拟城市(Sim City)”。AI 零碎会依据你玩游戏的形式做出相应的调整,从而带给你独特的游戏体验。这样你的游戏和他人不同,游戏体验也是举世无双的。

从游戏中,我学到的一点是要充分利用手中的每一笔资产。游戏里的资源是无限的,游戏的思维形式就是最大限度地利用残余资产,在国际象棋里,资源就是棋盘上的棋子。兴许这就是为什么我偏向于利用游戏来解决问题,我的确认为,利用游戏来开发 AI 是一种正当的形式。

写《主题公园》这个游戏时,我对 AI 曾经很感兴趣。这个游戏中 AI 的反馈当初来看绝对简略,但在 90 年代中期,它却是简单的。这让我意识到 AI 在游戏娱乐方面能够很弱小,它也是一种神奇到难以置信的弱小工具。过后,我就决定要把全副职业生涯都献给人工智能。

起初,我在剑桥大学读大学,零碎学习了计算机科学和数学。之后我开办了第一家游戏公司(注:电子游戏公司 Elixir,为包含微软在内的寰球发行商发明游戏),并卖掉了它回到伦敦大学学院(UCL)学习神经科学。

咱们曾经理解了逻辑系统、计算机科学中的无限状态机、种种规定和启发法,新式的人工智能曾经用过所有技术。但我感觉少了些什么,大脑会体现出学习、记忆和灵活性的想法,而计算机和人工智能零碎通常不会有。我试图去理解大脑工作的记忆和想象力两个方面,但咱们还不晓得这跟 AI 零碎有什么关系。

因而,我想在读博期间正式钻研大脑的思维,看看是否从大脑的工作形式、实现灵感的形式以及新类型算法、新类型架构或表征中取得一些启发。那些咱们不晓得如何在 AI 里开发的性能,或者能够参考大脑运行来实现。

我对大脑的理解比拟少,但 UCL 的共事 Eleanor Maguire 是钻研海马体的世界顶尖专家,她发现,大脑核心有个叫做海马体的区域,绝对较小,但十分重要。海马体在将近 100 年前就为人所知,如果它受到伤害,人就会失忆,像阿尔茨海默氏症这样的疾病,就是海马体受损导致的。

但我通知她,我真正想钻研的是想象力,它是人类智能中极其重要的一部分。我在设计游戏时就常常会设想,把游戏过程可视化,去设想一个玩家是如何玩“主题公园”这类游戏,而后再去调整一些细节,这是在脑海中或者草图上实现的,最初才会去写程序。你能够把它了解为,人在脑海中模仿将来可能产生的事件,这对打算能力和创造力起到很大的作用。

这就像咱们可能分明地记得本人身上产生的事一样,设想的过程是很类似的。所以, 我认为记忆和设想之间应该有一种分割,如同大脑的一个仿真引擎同时用在两者身上。

我曾假如,回顾过来是一个重建的过程。记忆不是录像带记录产生过的事件,而是重组信息的过程。这就是为什么记忆有时很容易出错,咱们会记住一些没产生过的事件。如果记忆就是这样造成的,那么大脑中的同样的机制对想象力也很重要,咱们能够把想象力视为结构的过程。 如果你认为记忆是一种对过来相熟场景的重组,那你能够把想象力看做成从过来场景中构建新的想法或设想,然而以一种新的形式组合在一起。 在我看来,结构想象力的过程与记忆重组有很多共同之处。

在海马体受损的病人身上,咱们验证了这个假如。通过测试了他们的想象力和反事实能力,比方,“设想你在红色沙滩上,能形容一下你四周的状况吗?”或者“想一下你将来的打算。”咱们发现,他们在想这些事时十分吃力。

某种意义上,他们被困在了当下,不记得过来,也难以想象将来。但如果你和他们聊五到十分钟,你会感觉,他们是齐全失常的,能够天然地解决当下的事件,除了无奈回顾过去和展望未来。

咱们最终发现了一个十分重要的后果:如果没有海马体,你就不能进行有画面的设想,海马体是记忆和设想这两种性能的外围。

在光明中摸索未知迷信时,任何提醒都十分贵重。 大脑能证实智能能够实现,它也是咱们领有的惟一证据。 我始终认为,不能漠视大脑的作用,它为构建 AI 提供信息。

因而,咱们用神经科学来做两件事:一是取得一些灵感,来思考算法、架构和大脑应用的表征,而后可能会有新型算法的灵感:二是验证,咱们可能曾经从工程学或数学中取得了一些构建学习零碎的想法,比方源于工程学学科和运筹学的强化学习,但在 90 年代,咱们发现大脑中也存在强化学习的一种模式。从 AI 的角度登程,这意味着强化学习是 AI 零碎的一个组成部分,因为它存在于大脑里,而大脑也是一种通用智能。

当你思考把工程资源和精力投入其中时,这一点十分重要。就算这当初还不起作用——正如在钻研或工程中,第一次的尝试个别都不会胜利——但它值得更多的投入,因为最终肯定会有用,因为大脑就是一个“概念验证(POC)”。

话虽如此,起初有的 AI 从业者和神经科学家认为,咱们须要齐全自下而上、亦步亦趋的在神经元档次上复制大脑,但这种办法是谬误的。咱们谋求的是零碎神经科学的办法,你能够对大脑的算法和架构感兴趣,但不肯定要关注具体的执行细节。这就好比计算机是硅基零碎,而人类大脑是碳基零碎,它们各有优劣,前者的各类细节没必要与后者截然不同。

无论如何,这些发现和我在博士期间学到的其余货色,成为我要在 AI 零碎中构建记忆和设想,思考如何开发通用人工智能、如何应答挑战的重要灵感。所有这些经验会集在一起,促使我想把计算机和神经科学联合起来,于是,2010 年左右,我想创建一家 DeepMind 这样的公司来钻研 AI。

能够说,我是从起点登程往回开始摸索,晓得了须要什么技能,怎么的经验,才可能去建设这样一家公司。

2

不走寻常路,拿到亿万富翁的投资

兴许很多人都不记得了,AI 在 2010 年还不是一个热门话题,很难为它筹集到足够的资金。当然,即便到了明天,基于科研的初创企业也很难融资,因为并没有一个明确的产品。

咱们要开发的是一项超乎设想的通用技术,随着这项技术倒退得越来越弱小,它能够利用范畴很广。但对欧洲或者英国的绝大部分投资人来说,这听起来有些不切实际,更像是学术界会做的,你不晓得它什么时候会起作用,这种技术兴许学术界会先钻研 10 年,而后当它能够利用时再去和投资人谈,他们通常心愿在 3 - 5 年内就取得 10 倍回报。

我的感触是,学术界的钻研节奏太慢了,而且如果成立一家研究型公司,三年后钻研工作可能都还没步入正轨,所以,我须要一个对 1000 倍回报更感兴趣的投资人,而且他违心期待 10 年甚至 20 年。

兴许在硅谷会有这种白手起家的亿万富翁违心投资,他们有足够的财力来赌一把,就算最初没有回报也没关系。同时,他们集体也对这类话题感兴趣,并且已经见证过宏伟目标大获胜利——他们就是这样做才赚到巨额财产。

在咱们寻找第一批投资者时,国际象棋还施展了十分间接的作用。通过背景调研,咱们理解到其中一位投资人曾是十分优良的美国国际象棋青年选手。咱们晓得,只有一小部分人能了解咱们要做的事,而他就是其中之一。咱们简直花了一年工夫做好与他会面的筹备。

一开始,咱们在硅谷没什么人脉,没机会见到他,起初,咱们设法加入了一个由这位亿万富翁资助的会议,可能会在会后的派对见到他,但问题是,过后有几百个人都在试图向他采购本人的想法。如果我跟其他人一样,间接抛出一个疯狂的想法,就不太会引起他的留神。

所以我想,不如先盘算一下,冒个险,和他聊聊国际象棋,然而我必须要想一些离奇乏味的内容。起初,我提到了一个甚至让国际象棋巨匠都感到诧异的特点,就是从一个游戏设计师的角度来思考国际象棋,为什么象棋如此平凡?它是如何演变成如此平凡的游戏?

我认为,这是国际象棋里主教和骑士富裕创造性的张力造成的。主教和骑士的价值大致相同——它们各三分,但却领有齐全不同的力量。主教和骑士被换到不同地位时会产生富裕创造性的不对称,我认为正是这种不对称让它成为一个如此迷人的游戏。

我都忘了是怎么在一个派对里插进了这段话,但这引出了我的想法,他开始停下来思考。之后,他邀请咱们第二天见面,失去了贵重的半小时向他介绍商业想法,而不是短短喝酒时的一分钟。最终,咱们胜利拿到了他(没错,就是马斯克)的投资。

3

成为 AI 界的“阿波罗打算”

在伦敦正式成立 DeepMind 之后,目前咱们领有超过 1000 名科学家和工程师。这是一个从两个圈子萃取精髓后造成的一个新组织:一方面,我致力从硅谷的一些最好的初创公司那里吸取经验,学习他们的关注重点、精力调配和工作节奏;另一方面,我想把这些特质和学术界的“天马行空的想像能力(blue-sky thinking)”联合起来,一群极其聪慧的人致力于钻研一些久远且重大的问题,并一直摸索未知领域。 通常,这两个圈子被视作截然相同的两个环境,很多公司都没这么试过,但这就是 DeepMind。

咱们的指标是开发 AI 的通用版本,愿景是成为开发“通用人工智能(AGI)”的“阿波罗打算”,就像实现人类首次登月一样,心愿为 AGI 畛域带来开创性的成就,承当简直任意畛域的工作,推动迷信和人类文明后退。

对于 AGI,其实没有对立的定义,咱们把本人钻研的货色称为 AGI,是为了区别于大家日常可能用到的如 AI 举荐零碎这样广义上的 AI。DeepMind 所认为的 AGI,是一种简直在任何场景都能够像人类一样(甚至比人类更强)认知、思考的零碎。

这样的 AGI 肯定能够实现,人脑就是最牢靠的证据,除非你认为大脑中有不可计算的货色。但到目前为止,还没有证据证实这一点。因而, 咱们应该能够在图灵机或计算机上无效模拟大脑的这些性能。

你可能会问,为什么要用人类作为参考规范?因为人类是目前已知的、宇宙中惟一的通用智能例子。人类智能发明出明天生存的美妙文化,足以证实人类智能如许通用、神奇,如果 AGI 能模拟人类的能力,那 AGI 就会成为供人类所用的十分有用的工具。要开发智能,首先要深刻理解天然智能,而后在人工结构中模拟它。

从历史上看,至多从 20 世纪 50 年代 AI 钻研就开始了,由图灵和麦卡锡这样的先驱引领。构建人工智能次要有两种形式,一种传统的形式是专家系统,比方超级电脑“深蓝”在 90 年代击败国际象棋世界冠军 Garry Kasparov。专家系统依赖的是硬编码常识,这种零碎由工程师和科学家设计,他们首先必须确定一种解决方案,而后编写进机器里,成为一套固定的规定让机器执行。

但专家系统的问题是,它们无奈解决未知状况,只能局限于事后编程的解决方案。专家系统诞生自数学运算,由逻辑系统驱动,成为 AI 发展史中前五六十年的支流形式。

当初,一种新的形式是学习零碎。它能够让 AI 间接依据根本准则、原始数据和理论教训主动学会如何解决状况。学习零碎能够对新状况和新工作进行综合评估,并无望解决零碎设计者未能解决的问题。这就是学习零碎的潜在神奇之处。

这类学习零碎衍生出神经网络、强化学习等技术,很多都以零碎神经科学中一些被实际证实的概念为灵感根据,但它们并不是齐全模拟人脑的运作,毕竟咱们目前对人脑的理解还不够。总的来说,学习零碎就是模拟人的思考,并以通用性和学习能力为重点。

学习零碎有很多种,DeepMind 研发的最驰名的一种就是强化学习零碎。这是一种依据根本准则、通过简单试错造成的学习模式。

通常,在一个学习零碎中,有一个智能体(Agent)处在一个环境中。环境能够是真实世界,那么对应的智能体则是实体机器人;环境也能够是虚拟环境、模仿环境或者游戏环境,这时的对象则是一种数字化身(Avatar)

智能体通过本人的察看取得环境信息,通常咱们设计的察看形式是视觉模态,但也能够用听觉、触觉等其余模态。察看取得的信息往往横七竖八而且不残缺,智能体施行察看后,首要任务就是建设无关环境的模型,了解环境是如何运作的。

智能体通常有一个想要在环境中实现的指标,这个指标是零碎设计者制订的,比方博得一局游戏、实现得分最大化等。所以它第二个工作就是,思考、抉择出能让它逐渐凑近指标的最佳口头计划。

怎么找到最佳计划?依据第一步建设的环境模型,须要预测某个口头对环境有什么影响、会产生何种新的环境信息、以及这样的环境信息是否有利于指标的实现。

以上的思考完结后,智能领会确立口头计划,并采取行动。这个口头可能会对环境产生影响,也可能不会。这是一个动态变化的过程,意味着智能体是一个灵便的学习者,而不只是被动地依赖既定数据。它采取的某一步口头,能够影响下一步接管到的环境信息。所以这是一个被动学习零碎,就像动物和人类的学习经验一样。

那么,DeepMind 研发的 AI 能解决什么类型的问题?能够说,咱们研发的 AI 是块砖,哪里须要就往哪儿搬,咱们在一直地拓展 AI 的能力。

对迷信或初创企业来说,你的谋求要超前于时代,但不能太超前,不然就会陷入苦楚之中。就像 Charles Babbage 一样(译者注:他在 19 世纪初期提出了差分机和剖析机的概念,被视为计算机先驱),我感觉他比他的时代超前了 100 年,做出了十分平凡的工作,但却是一个充斥遗憾和悲伤的人生故事。

以后,咱们判断某个问题能不能被 AI 解决,会根据三个规范:

第一,这个问题能不能被形容 / 演绎为某一大型组合化的搜寻空间 / 状态空间(即所有可行计划的集)? 因为如果不能的话,则难以使用专家系统来预设解决方案,而要应用“蛮力”来穷尽所有可行解决方案也是困难重重。咱们须要这样的一个规范。

第二,这个问题有没有清晰可量化的指标,能让咱们依据这个指标来逐渐优化学习零碎? 比方,游戏的指标就是分数。

第三,这个问题有没有短缺的数据可供零碎学习? 现实的状况是能够构建一个精确而高效的模仿安装来生成大量数据。只有数据是在正确的条件下生成,应用人工生成的数据来供零碎学习也是可行的。

以上就是判断 AI 是否解决某一问题的三大规范。尽管听起来很刻薄,但其实还是有很多问题可能同时合乎这三大规范。此外,咱们还心愿在相应问题的畛域中,存在一些可供 AI 比拟的内部衡量标准。 最初,咱们心愿 AI 所解决的问题可能产生较大的上游影响。

游戏仍然是一个很好的例子。用游戏作为算法的训练场景,它能够在线上或云端同时运行数百万个算法,特地高效,而且游戏有很清晰明确的度量指标(打赢游戏或得分最高),来判断 AI 体现得好不好。当然,我的游戏从业背景也是咱们抉择从这一场景切入的一个起因。

如你所知,2016 年,AlphaGo 的呈现击败了世界围棋冠军,这令人激动,起初还倒退出能自我对弈的 AlphaZero,这是一个通用棋类 AI。咱们都喜爱游戏,作为大规模的工程项目,它教会了我创造性思维,现在咱们还把游戏作为次要形式,证实了一些 AI 算法。不过,这并不是 DeepMind 为 AI 定下的最终目标,咱们心愿不只是游戏届的最强王者,而是成为 AI 届的“阿波罗打算”,通过设计通用算法,使用 AI 去解决真实世界里的重要问题,尤其是在迷信摸索畛域,这也是我集体对 AI 研发的心之所向。

最让我感到心潮澎湃的是,咱们行将开启一个 AI 的“黄金时代”,而咱们正站在这个时代的开始。

4

AlphaFold 开启数字生物学新纪元

10 年前,基本上还没人探讨 AI,咱们通过“求爷爷告奶奶”的形式才筹到大量启动资金。但 DeepMind 成立的 12 年以来,咱们目击了 AI 和机器学习令人难以置信的疾速倒退,终于在 AI 钻研方面获得足够的提高,能用 AI 去做真正想做的事件。

除了游戏,咱们起初发现,蛋白质折叠问题也合乎咱们用 AI 解决方案的判断规范。所谓蛋白质折叠,就是一维的氨基酸序列折叠成 3D 的蛋白质构造。

1972 年,Christian Anfinsen 在其诺贝尔奖获奖演讲中提出了一个驰名假如: 蛋白质的 3D 折叠构造,齐全取决于它的氨基酸序列。 自那以来,人们付出了 50 年的致力,想证实这个假如,弄清楚如何依据蛋白质的氨基酸序列精确得悉其 3D 构造。这个问题有点像费马大定理——实践上可行,但证实过程太难了。

蛋白质折叠确实合乎我所说的三个规范。首先是状态空间(可行的计划集)。与 Anfinsen 同期间的另一位科学家莱 Cyrus Levinthal 提出了一个驰名的悖论,他计算出,一般蛋白质有 10300 种可能的构造,如果蛋白质只是随机折叠,以此来摸索所有可能的构造并找出最合适的一种,这简直不可能,但自然界中,蛋白质却能在几毫秒内自发折叠。所以,蛋白质折叠问题的状态空间就这么宏大,甚至比围棋的还要大。

另一个问题是:能不能通过计算来预测蛋白质构造。

我集体跟蛋白质折叠问题有挺深的渊源。90 年代在剑桥大学读书时,我从一个敌人那里第一次理解到蛋白质折叠问题,这位敌人至今仍在剑桥分子生物学实验室(LMB)工作,始终在钻研蛋白质构造。 当年,他和我经常聊到,蛋白质折叠问题是人类最须要解决的问题之一,无论在哪儿,咱们俩简直一见面就聊这个问题。

过后我还在做 Theme Park 等 AI 游戏,那时就在想,等 AI 倒退到肯定阶段,说不定就能够用来钻研蛋白质折叠问题。

第二次接触蛋白质折叠大概是在 2008 年,那时我在 MIT 当博士后研究员,有一款叫 Foldit 的游戏刚刚面世(Foldit 是一款由华盛顿大学等机构联合开发的蛋白质折叠游戏),这种公众迷信游戏(译者注:“公众迷信”,又称“群智迷信”,由业余迷信爱好者参加的科研活动)的想法太有意思了。我认为公众迷信能够有更大的倒退,就像 Foldit 游戏一样,集中所有玩家的能源和精力,来为蛋白质折叠钻研做奉献。也就是说,咱们能够把其余迷信问题融入游戏里,调动群智群力来帮忙解决它。

这种做法的乏味之处在于,游戏玩得最好的往往不是生物学家,而是一般玩家,他们很可能比科学家更快破解出某种蛋白质的实在构造。 一些由 Foldit 玩家破解出的重要蛋白质构造还发表到《Nature》杂志上了。Foldit 游戏有点像益智游戏,玩家要找到能量最低的蛋白质骨干折叠形式(蛋白质的人造构造往往就是它的能量最低构象)。

有时候玩家须要进行反向操作——先找到能量较高的折叠形式,再钻研怎么折叠才会升高能量。这时,游戏玩家就有点像业余生物学家了。他们如果喜爱这个游戏,而且玩得特地好,就可能使用本人的直觉和图形处理能力,去找到正确的蛋白质折叠形式。事实证明,有些玩家在这方面确实有十分杰出的直觉。

Foldit 的胜利让我看到一种心愿: 要人工构建一种零碎,让它具备能与围棋巨匠相媲美的直觉,这是可能做到的。 所以咱们在研发 AlphaGo 的时候,思路跟 Foldit 差不多,也是模仿那些下了一辈子围棋的围棋巨匠们的直觉。

2016 年 3 月,咱们从首尔回来的第二天,就决定启动 AlphaFold,至今曾经六年了。

抉择蛋白质折叠作为咱们想用 AI 解决的问题的另一大起因是 CASP(一项寰球范畴的蛋白质构造预测比赛)的存在,这样咱们就能够对标 CASP 来评估 AI 的蛋白质构造预测能力。

CASP 比赛的创办者是 John Moult 和他的团队,自 1994 年开始,每两年举办一次,迄今曾经快 30 年了,很了不起。这个比赛的一大重点是,预测试题是一些新发现的、还未发表的蛋白质构造,参赛选手并不知道这些构造,从零开始的预测也就不会像机器学习一样,呈现数据适度拟合等问题。

CASP 比赛在夏天举办,几个月后,正确的蛋白质构造会公布出来,而后大赛就会比对这个构造给每支队伍的预测打分。CASP 的分数叫做 GDT 值,能够简略地把它了解为“准确率”。“自在建模”是 CASP 最难的我的项目,2006 年 -2016 年间的准确率晋升十分迟缓。

DeepMind 暴发史:决定 AI 顶峰的“游戏玩家”|深度学习崛起十年
2018 年,DeepMind 带着 AlphaFold 加入了第 13 届 CASP 比赛,首次把尖端机器学习技术使用到了构造预测畛域,一举夺冠,而且预测准确率比今年冠军队伍高出近 50%。

不久后咱们发现,过后使用的技术曾经没有优化空间,所以依据 2018 年的参赛教训,咱们从新构建了零碎,心愿能达到更高的准确率。2020 年,在第 14 届 CASP 比赛上,咱们用 AlphaFold 2 再次让预测准确率飞跃到新台阶。

咱们始终心愿预测能达到原子精度(物理上的最高精度)。在 2020 年 11 月的 CASP 比赛上,咱们达到了这个指标,过后咱们的中位数误差不到 1 埃米(1 埃米 =10^-10 米,大概为 1 个原子的长度),把误差放大到了原子级。

CASP 的主办方通知咱们,这能够和实验室办法媲美,更重要的是,咱们的技术能够供科研人员所用。 咱们的误差的精确数据是 0.96 埃米,仅仅是亚军队伍的误差的 1 /3,而亚军队伍至今沿用的仍是 AlphaFold 1 技术。其余队伍应用的简直都是机器学习技术,但 AlphaFold 2 的预测误差仍然最小,而且比其余的小得多。

在得悉比赛后果后,团队成员都惊叹于 AlphaFold 2 的预测构造是如许完满地符合实在的蛋白质构造。此外,在特定状况下,咱们对 SARS 病毒和新型冠状病毒的蛋白质侧链构造的预测也相当精确。

这些只是开始,咱们当初正在向其它新畛域迈进。咱们能够利用 AI 和计算方法来钻研蛋白质复合物,AlphaFold-Multitimer 能够在不同方面发挥作用:无序蛋白质、点渐变、配体对接、蛋白质相互作用和蛋白质设计。

值得一提的是,目前咱们正在寻找生物学家认定的可能导致下一次大流行病的前 20 种病原体,而后折叠它们所有的蛋白质,推断可能会产生哪些病毒。在将来几年内,咱们还将实现自动化的药物研发流程。咱们不仅会给出蛋白质的构造,甚至还能够提出可能须要什么样的化合物。另一方面,AI 能够在剖析方面跟踪趋势,并预测流行病流传后可能产生的状况。

我认为,AlphaFold 就是咱们的第一个大规模 AI 用例。它唤醒了科学界,让他们意识到 AI 能够做些什么。

咱们正在开启一个新时代的大门,那兴许就是数字生物学畛域(相干浏览:《与吴恩达开办 Coursera 后,她一头扎进数字生物学》)。

生物学是一个信息处理系统,生命是非常复杂的,这是一个创发性的过程(emergent process),无奈用简洁的数学方程来形容。只管数学家们在尝试这样做,不过,我认为它们不会成为细胞的“牛顿运动定律”。它的创发性、互动性和动态性太强,但让 AI 用正确的形式找出强劲信号中的所有模式,这可能是一种完满的机制。

我心愿 AlphaFold 是一种重要的概念性证实,它开启生物学的新纪元,用计算方法和人工智能办法来帮忙生物零碎建模,从而推动生物学获得新发现。

我认为,机器学习是形容生物学的最佳语言,就像数学是形容物理学的最佳语言。

过来 50 年,许多人都试图将数学利用到生物学,并获得了一些胜利。但数学家用数学的办法解释生物学还是太简单了,他们无奈简略用几个方程式说分明。机器学习就很适宜,它十分善于接管并了解强劲信号和芜杂信号,这和生物学中的机制刚好是一样的。

利用于生物学的 AI 会有更多的飞跃,能不能获得飞跃的关键在于:咱们能不能充沛模仿动静环境。这就引出下一个问题:AI 零碎真的在学习吗?AI 能充沛学习环境的物理属性吗?了解动静环境是下一个大挑战,显然,还没有人晓得这是否可能,但我认为这是能够做到的。

数字生物学代表着的新时代的开始。这个幻想是将来能发明出一个相似残缺的虚构细胞模仿(virtual cell simulation),能够在生物信息学(silico)中进行查问和试验,而后通过试验进行验证。

就迷信发现而言,事实上,无论是 AlphaFold,还是在量子化学、纯数学交融基因组学等其余前沿科学畛域引人注目的论文和冲破,都令人惊奇,置信将来还会有更多。

我只想说,就像哈勃望远镜让宇宙学家深刻意识宇宙,我也想建造一个终极的 AI 通用工具来帮忙科学家们看得更远一点。

5

逆向工程:AI 黑盒的可解释性

当咱们将 AI 使用到医疗保健、乃至蛋白质折叠等畛域时,AI 的可解释性是相当重要的。

我想问的是,你在多大程度上了解 AlphaFold 的决策过程?AlphaFold 将来会是什么样的?比方,它会为了获得好的后果而扩散资源,还是基于深度学习网络真正了解本人该干什么?

目前的广泛说法是,AI 是黑盒零碎,确实是这样的,给 AI 输出数据,而后训练它们提供输入,而 AI 的输入也是你掂量 AI 能力的规范,你并不需要太关怀 AI 的整个解决流程。但 DeepMind 的工程师和科学家想理解 AI 是如何做到这一点的。兴许,有一天你能够设想逆向工程呈现一些人类可解释的原理。

AI 是一门“工程迷信”,它与自然科学有什么不同?自然科学所钻研的景象曾经存在,但对它钻研、合成并简化为原理是非常复杂的。对于工程迷信,咱们必须先建造人工产品,而后能力剖析它,但这种剖析并不比剖析天然景象更容易。AlphaFold 就是这样,它非常复杂。

直到现在,我认为在了解 AI 黑盒方面还没有付出太多致力,还没有真正做任何乏味的事件。 如果一个人要花五年工夫去剖析一个黑盒,那最好是这个黑盒正在做一些有价值的事件。

目前,我能想到最好的例子是 AlphaZero 零碎。棋类 AI 是 AI 钻研最多的畛域之一,这一钻研从图灵和香农时代就开始了,他们两位发展了很多对于 AI 下棋的驰名钻研。

咱们晓得国际象棋的规定是什么样子的,经典零碎应用了这些启发式办法,所以咱们想晓得能不能从 AlphaZero 网络中提取这些规定,比方国王平安、皇后挪动、棋子的数量、分值等。事实证明,咱们能够进行逆向工程,先理解 AlphaZero 对棋局的了解,而后将其与经典 AI 机器所进行比拟。

DeepMind 也有一个残缺的神经科学团队,他们至多应该理解这些人工网络,就像理解天然大脑一样,只管人类的大脑也有点像黑盒,但咱们当初能够做性能磁共振成像和单细胞记录,所以对大脑有更多发现。有了人工大脑的状况下,咱们有更多的自在做各种钻研。DeepMind 团队在钻研建设这些类型的剖析工具,咱们称之为虚构大脑剖析,这自身是一个迷人的钻研畛域。

因而, 我认为 AI 黑盒不是根本性问题,它们是能够被理解和分析的。 在这方面,咱们仍处在 AI 倒退的临时过渡阶段。当初有了像 AlphaFold 2 这样值得花工夫去理解的 AI 零碎,接下来的 10 年里,会呈现更多用于剖析重要零碎的可视化工具,所有才刚刚开始。

6

离 AGI 到底还有多远

对于 AI 来说,当初一个十分激动人心的时刻。但我不想让大家认为,咱们离人类程度的通用人工智能很近了。

AGI 自身就是一个宏大的长期钻研指标,我认为离 AGI 还有几十年的工夫,还有很多挑战须要克服。比方无监督学习(Unsupervised Learning),也就是在没有任何回报的状况下学习;记忆和单样本学习 (Memory and One-shot Learning),让零碎从繁多教训中学习,而不须要数百万种教训;基于想象力和生成模型的布局(Imagination-based Planning with Generative Models),让零碎能使用想象力,设想将来及打算;迁徙学习(Transfer Learning),让零碎把常识从一个畛域迁徙到另一个它从未见过的新畛域;学习抽象概念(Learn Abstract Concepts)以及了解语言(Language Understanding)。

即便如此,AI 到目前为止的停顿速度都是相当惊人的, 如果在将来一二十年里实现 AGI,我并不会十分诧异。

如果你违心尝试一番,那在此过程中产出的任何技术都能够拆分进去,而后利用到其余事件中去,并且后果会让你大吃一惊。咱们认为,为这一雄心勃勃的、长期的钻研指标而奋斗是发明可利用技术的最佳路径。

我始终幻想的后果是,AGI 帮忙咱们解决当今社会面临的许多重大挑战,如医疗衰弱和新能源开发等。我所看到的是一种惊人的凋敝,AGI 作为一项十分弱小的技术将有助于进一步开释人类的后劲。

我构想的是,有些 AI 零碎首先将开始可能应用语言,只管这在当下已实现,但我认为将来它们将能更好地应用语言。而后,咱们人类会与 AI 零碎有越来越多科学性的协同工作。当咱们用 AI 零碎来执行不同工作时,AGI 的组合包也将进一步倒退,之后咱们甚至能够用 AGI 来管制一个核聚变电站。

最终,咱们能从各类工作中形象出一个零碎、一组想法或算法。一旦走到这一步,就会呈现哲学上的争执。比方 AI 零碎是否笼罩了人类所能做的所有事?我认为,它在某些方面必定会超出人类的能力范畴。然而,只有 AI 零碎是以正确的形式实现这些事件就令人激动。

一些认知科学家也会去钻研 AI 零碎是否和人类一样具备认知能力,如创造力、情感、想象力以及记忆等。而后,咱们就会主观认为 AI 零碎正在变得越来越聪慧,这也解释了为什么我会认为这是人类有史以来踏上的最激动人心的一趟旅程。咱们试图借助从神经科学那里获取的灵感来构建 AGI,这有助于咱们进一步理解本人、理解人类思维。

一旦实现智能,AGI 将帮忙咱们解决当今社会面临的许多重大挑战。比方治愈阿尔茨海默氏症等疾病,以及获取便宜、丰盛的可再生清洁能源,这可能须要核聚变或者仅仅是更好的太阳能电池板、电池和室温超导体来解决,咱们都应该尝试一下。如果胜利了,那也会解决很多其它问题,比方通过淡化淡水获取洁净水资源,随着世界人口的增长,在一些贫苦国家,水曾经变得比石油更贵重,所以获取便宜能源才是问题所在。

在核聚变畛域,可能咱们会提出应用相似 AlphaZero 的零碎,这种电池能效要比当初的电池高出 50%、续航工夫要长 10 倍,而价格却只有其 1 /10。或者咱们会创造出一种太阳能电池板,应用光伏资料,将热能转化为电能的效率晋升两倍,到时德克萨斯州一半面积铺上的电池板所产生的能源够全世界应用。这个办法当初还不是很高效,但如果有室温超导体一旦成熟,那利用太阳能将变得更加可行。

在材料科学畛域,AI 将提供更多、更好的组合计划,你能够将所有不同的化合物组合在一起,而后决定哪个才是最好的。

就像我常常对他人说的那样: 不论你的问题是什么,答案都是 AI。 因为它在某种程度上是个下限,这可能有点草率,但目前咱们所有问题的答案——比方咱们为什么在这里,为什么咱们在对话,为什么咱们应用这些了不起的计算机和设施——答案都是因为人类智能,我认为这是奇观般的迷信办法。

另一件奇观般的事是,自启蒙运动以来,迷信的办法始终是卓有成效、颠扑不破的。你可能思考过“为什么宇宙会这样运行”的问题,这也阐明迷信的办法总是无效的。如果宇宙是随机运行的,那么迷信办法就行不通。 世界的运行是有法则可循的,是前后一致的,因而,科学知识也成为可能。

同时,令人感到惊奇的是,咱们的大脑——只管是为了狩猎和采集而进化的——却能以某种形式解释这样的法则——这自身未然是一种奇观。那么,面对这样的奇观,首先,咱们怎么会不想要钻研这些问题呢?其次,咱们为什么要给大脑的能力设限呢?

至多从我感性、合乎逻辑的角度来看,事件就应该是这样产生的,这也正是我钻研 AI 的出发点。咱们要尽全力思考本人能做些什么,要从文化的角度思考产生了什么。兴许你会感觉这有点奇怪,但我认为这是正确看待事物的形式,大多数人都没有以正确的形式思考问题。 兴许这就是我毕生都在做的事:试着提出正确的问题。

另一方面,我最大的担心之一是,人类在通往实现 AGI 的路线上将会如何应用 AI 技术。像大多数技术一样,AI 可用于好的方面,也可用于坏的方面,这取决于社会和政府决定如何使用它们。

当然,咱们不能过分夸张 AI,很多人认为 AI 曾经能够做任何事件,但实际上,如果他们真正地理解 AI,就会晓得这项技术并不齐备,以后的局部忧愁有些是适度的。

比方 AI 零碎耗能问题,即便是大型模型,也只消耗了寰球能源很小的一部分。与在线观看视频相比,这些 AI 零碎须要只须要更多的计算机和带宽。另外,当初大多数的大数据中心简直都是 100% 碳中和的,尤其像谷歌这样的公司。

医疗保健零碎或能源应用零碎中,大多数 AI 模型对环境的影响都是“净侧面”的。咱们曾经证实,开发 AI 模型实际上能够优化能源零碎自身。例如,咱们的 AI 零碎的最佳利用之一就是通过给数据中心制冷散热,节俭了 30% 的所需能源,这可能比咱们用于所有 AI 模型的能源总和都要多得多。

当然,咱们要确保 AGI 合乎人类的价值观,像人类一样制订正当的指标,咱们认为人工智能不应该被利用到军事等畛域,须要制订规定将不可控因素的影响降到最小。实际上,生物学畛域有几十年解决这类问题的教训,比方设计合成生物学、病毒、胚胎学、CRISPR 等等,他们的科学家和更宽泛的社会个人、监管部门一起,独特找出对每个人都平安的路线规定,我认为这是将来十年在 AI 畛域必须协调的事件。

作为 DeepMind 的领导者,咱们始终在思考道德伦理问题,在幕后其实做了很多事件。我也心愿能够影响其他人,毕竟咱们在技术上处于领先地位,这一点十分重要,否则他人凭什么要听你讲道德层面的事件?不是哪个群体讲道德伦理大家都会听的。 要想有发言权和说服力,无论是国家、公司,甚至是集体,必须理解技术前沿。

怎么晓得曾经实现了 AGI 的构建?这是一个哲学问题。对我来说,我正在期待许多要害的工夫点,例如,AI 零碎涌现新的迷信发现,并达到诺贝尔奖的程度, 这对我来说将是一个分水岭,这将是这些零碎能力倒退的重要一步,在某种意义上可能实现真正的创造力。 另一个重大工夫点是 AI 能够应用语言,可能用天然的形式与咱们交换,可能学习抽象概念, 这些都还是咱们远未实现的高级认知能力,这也会是将来的重要节点。

7

追寻心田的深切渴望

十几岁时,我就有了 AGI 的这些想法,我猜可能是因为读了太多科幻小说。比方阿西莫夫的《基地(Foundation)》系列小说,这是超乎设想的科幻巨作。还有 Ian Banks 的《文化(Culture)》系列,这是一部太空歌剧(Space Opera),探讨在人类曾经建设了 AI 并与其共存之后,宇宙将会是怎么的。

Hofstadter 的《哥德尔,埃舍尔,巴赫(Gödel, Escher, Bach)》这本书对我来说十分重要,这是我在做“主题公园”时读到的,更像是一本哲学书,它把哥德尔对于数学的不完全性定理联合在一起,通过埃舍尔的画作和巴赫的赋格曲,展现了它们在某种程度上是互相关联的,有一种反复的、有限的模式循环,而后他将其与意识和智慧分割起来。我真的很受启发,这本书让我思考一些粗浅的问题。

如果咱们不止于把 AI 用在游戏里,而是把它晋升到与人类雷同的程度,那么 AI 的极限会是什么?我过后的小伙伴认为 AI 没有极限,所有皆有可能。兴许我能够换个说法,如果环视四周,你会看到不堪设想的现代文明。那是什么造就了现代文明?人类智能。

如果回到人类以狩猎为生的时代,你说有一天咱们会建造出纽约曼哈顿区,咱们会定期乘坐上百吨重的 747 飞机在云端从伦敦飞往曼哈顿,这真的超乎设想。然而,人类就是用猴子脑袋难以置信地做到了这一点。咱们无需停下来思考这是如许令人诧异,因为人类大脑的另一个特点是十分可能适应环境,当咱们曾经做进去了某件事情,它就变得有点无聊和一般,有些琐碎。

这样一想, 如果咱们当初开发 AGI,并用这个了不起的工具加强人类的能力,我感觉在物理定律范畴内,甚至可能在物理定律之外,简直任何事件都是可能的。 有了 AI,咱们可能会发现更多无关物理定律的信息,或者发现对物理定律的了解有一些破绽或缺点。

我想理解人类大脑里的宇宙和实在的宇宙中产生了什么,始终驱使我的是对探寻这一乏味、迷人神秘的深切渴望,我不明确为什么有人不会去思考这个谜团。

我被难以了解的事物迷住了,也感到困惑,简直无奈入睡,想着那些大问题,比方生命的意义、宇宙是怎么开始的,什么是意识等等,所有这些在我的头脑中像是刺耳的汽车喇叭。我想弄懂这些问题,我开始尝试的第一步就是开发人工智能。

我对将来十分乐观,因为 AI 正在倒退,如果咱们以正当的形式开发、部署 AI,来造福社会,那这将是人类有史以来最了不起的、变革性的技术。 试想一下,如果有了 AGI 这样的技术,几百年后的世界会是怎么的?能够用 AGI 构建什么?那时的状况超乎设想,人类将会施展真正的潜能。

很久以前,我就构想过 AGI 那一天的到来:有一天,你走进办公室发现代码只是在失常执行,但等第二天你再进来的时候,却发现它却仿佛能感知到你的呈现。如果这种状况真的产生的话,某种意义上来说会很美妙。但我猜测,当咱们开始靠近这个场景时,咱们会感觉乏味,也会有些奇怪。

我认为,咱们开发的零碎并不全部都是没有感知或意识的。 感知或意识也能够只是一种程序,只有 AI 学会了,它们就会执行。 我始终特地关注 AGI 是否提出了全新想法,发明新事物,又或者提出新的迷信实践,并用它来解决问题。在那个“重要的”日子到来之前,这些事件将是我致力和奋斗的方向。

参考链接:

  • https://www.youtube.com/watch…
  • https://www.youtube.com/watch…
  • https://www.youtube.com/watch…
  • https://www.youtube.com/watch…

欢送下载体验 OneFlow v0.7.0 最新版本:
https://github.com/Oneflow-In…

正文完
 0