关于人工智能:引领人工智能时代世界需要新的图灵测试

– 古代计算之父必定会向 ChatGPT 张开双臂。

在过来，过后图灵测试仿佛是一个相当严格的机器智能探测器。你可能对它的工作原理很相熟：人类法官与两个暗藏的对话者（一个人和一台计算机）进行文本对话，并尝试确定哪个是哪个。如果计算机可能愚弄至多 30% 的评委，那么它就通过了测试，并被认为具备思考能力。

70 年来，很难设想一台计算机如果不具备人工智能钻研人员当初所说的通用人工智能（即人类全副智力能力），如何可能通过测试。而后呈现了 GPT 和 Bard 等大型语言模型，图灵测试忽然开始显得异样过期。好吧，当然，明天的普通用户可能会耸耸肩抵赖，如果你要求 GPT-4 模拟人类，它很可能会通过图灵测试。但那又怎么呢？法学硕士不足长期记忆、建设关系的能力以及一系列其余人类能力。在咱们筹备好开始与他们交朋友、雇用他们并选举他们负责公职之前，他们显然还有很长的路要走。
是的，兴许当初的测试的确感觉有点充实。但这不仅仅是一个通过 / 失败的基准。它的创造者艾伦·图灵（Alan Turing）是一位在他那个时代被判处化学阉割的同性恋者，他的测试基于一种激进的包容性精力：真正的智力和齐全令人信服的智力模拟之间的差距只与咱们本人的偏见一样大。当计算机激发咱们真正的人类反馈时——调动咱们的智力、咱们的诧异、咱们的感谢、咱们的同理心，甚至咱们的恐怖——这不仅仅是空洞的模拟。

所以兴许咱们须要一个新的测试：理论的艾伦图灵测试。带上历史悠久的古代计算之父阿兰·图灵——一个高大、衰弱、有点蠢笨的男人，有一头黑直发，因其孩子般的好奇心和俏皮的风趣而受到共事们的青睐，他集体在第二次世界大战中破解了纳粹恩尼格玛明码，援救了大概 1400 万人的生命，随后受到纳粹的重大迫害。英格兰因同性恋而他杀——这可能导致他他杀——他走进一间舒服的实验室，桌上放着一台关上的 MacBook。解释说他眼前看到的只是当初被计算机科学家宽泛称为“图灵机”的一个极其光荣的化身。给他一两秒钟的工夫来真正了解这一点，兴许能够对他彻底改变咱们的世界表示感谢。而后递给他一堆对于人工神经网络和法学硕士的钻研论文，让他拜访 GPT 的源代码，关上 ChatGPT 提醒窗口，或者，设想一下艾伦·图灵发动了一场对于短跑、二战史学和计算实践的轻松对话。设想一下，他看到本人所有最疯狂、最可笑的猜想都以惊人的速度在屏幕上滚动。设想一下，他要求 GPT 解决根本的微积分问题，推断人类在各种事实世界场景中可能在想什么，摸索简单的道德窘境，提供婚姻征询和法律倡议，并论证机器意识的可能性——这些技能你通知图灵，它们都是在 GPT 中自发呈现的，没有其创建者的任何明确批示。设想一下，他正在经验咱们很多人当初都感触到的那种小小的认知情感歪斜：你好，另一个想法。

像图灵这样粗浅的思想家不会对 GPT 的局限性熟视无睹。作为重大恐同症的受害者，他可能会对 GPT 训练数据中隐含偏见的危险保持警惕。在他看来，只管 GPT 的常识广度惊人，但其创造力和批判性推理能力充其量只能与怠惰的本科生相媲美。他必定会意识到，这名本科生患有重大的顺行性遗忘症，无奈在强化教育之外造成新的关系或记忆。但依然：设想一下图灵奇观的规模。从真正意义上来说，他背后笔记本电脑上的计算实体是他的智力孩子，也是咱们的孩子。最终，随着孩子的成长和倒退，观赏他们的智力始终是一种惊奇和爱的行为。理论的艾伦图灵测试基本不是人工智能的测试。这是对咱们人类的考验。咱们是通过了还是失败了？

当 CHATGPT 达到时它于 2022 年 11 月呈现，引发了一场全球性的震惊海啸，而后简直立刻引发了强烈的不安。专家们争执了它对社会造成毁坏的可能性。对于像我这样的前人工智能研究员（我在人工神经网络的晚期先驱之一的领导下实现了博士学位）来说，它代表了我对类人人工智能到来的预期工夫线的令人不安的提前。对于各种类型的考试评分者、编剧和常识工作者来说，ChatGPT 看起来无异于不受限制的舞弊和窃取工作的门户。

兴许局部是为了回应这些担心，法学硕士平减指数的呈现令人欣慰。科幻小说作家 Ted Jiang 将 ChatGPT 斥为“网络上含糊的 JPEG”，仅仅是对其所训练的所有文本的稀释概括。人工智能企业家加里·马库斯称之为“类固醇主动实现”。诺姆·乔姆斯基谴责它体现出“邪恶的平庸”。Emily Bender 提出了一种更为高调的诋毁：“随机鹦鹉”，这在 2021 年一篇被宽泛援用的论文中从新呈现，该论文探讨了“为什么人类将 LM 输入误认为是有意义的文本”。当然，其他人则将它们视为烤面包机。人工智能开发人员致力训练和阻止法学硕士宣称任何相似于意识的偏向。

大多数受过教育的人当初都晓得法学硕士是没有思维的机器。但这种分类却令人不安。每当 ChatGPT 指出一篇文章中暗藏的推理差距，或者为向激进的祖父母出柜提供令人诧异的富裕洞察力的倡议，或者乐不可支地假造一个蹩脚的笑话时，咱们心田的某些货色就会被拉向另一个方向。尽管咱们可能不认为 ChatGPT 是一个人，但咱们大脑的要害局部简直必定是这样的。

最终，随着孩子的成长和倒退，观赏他们的智力始终是一种惊奇和爱的行为。

人类大脑领有宏大的神经回路网络，致力于社会认知。其中一些十分古老：岛叶、杏仁核、静止皮层驰名的“镜像神经元”。但咱们的大部分社交硬件都位于新皮质，这是最近进化进去的高级推理的所在地，特地是内侧前额皮质（mPFC）。如果您发现自己随着工夫的推移逐步造成这样的印象：ChatGPT 的乐于助人、有点迂腐的简短、偶然对敏感话题采取令人发狂的不偏不倚的态度，以及对任何靠近情感、信奉或意识的问题的极其敏感，那么您人们始终在获取心理学家所说的“集体常识”，这一过程与 mPFC 的流动加强无关。

这并不是说咱们的大脑将 ChatGPT 视为一个残缺的人。人格不是二元的。它有点靠近频谱。咱们的道德直觉、认知策略以及某种程度上的法律框架都在逐步扭转，因为它们意识到代理、自我意识、感性和沟通能力的水平一直进步。杀死一只大猩猩比杀死一只老鼠更让咱们懊恼，而杀死一只老鼠又比杀死一只蟑螂更让咱们懊恼。在法律方面，堕胎法思考到胎儿的发育水平，立功的精力错乱者面临着与神志失常的人不同的结果，伴侣有权终止脑死亡患者的生命。所有这些规定都隐含地抵赖人格不是非黑即白，而是充斥了简单的灰色地带。

法学硕士正好属于这个灰色地带。长期以来，人工智能专家始终对公众将法学硕士等人工智能零碎拟人化的偏向保持警惕，这将他们推向比理论更进一步的人格范畴。这就是 Google 工程师 Blake Lemoine 所犯的谬误，他声称 Google 的聊天机器人 LaMDA 齐全有感知能力，并试图为其延聘律师。我狐疑即便是图灵也不会宣称 LaMDA 显著的思考能力使其成为法人。如果用户认为像 LaMDA 或 ChatGPT 这样的聊天机器人过于人性化，他们可能会过于信赖它们，与它们分割得太深，从而感到悲观和受伤。但在我看来，图灵更关怀的是相同的危险：将人工智能零碎推向人格的领域，而不是向上。

对于人类来说，这被称为非人化。学者们曾经确定了它的两种次要模式：动物性的和机械性的。与动物性非人化最常见的情感是讨厌。Roger Giner-Sorolla 和 Pascale Sophie Russell 在 2019 年的一项钻研中发现，当别人激发恐怖时，咱们偏向于将其视为机器。在埃隆·马斯克和其余科技首领最近呐喊暂停人工智能开发的公开信中，以及咱们对工作代替和人工智能驱动的错误信息流动的焦虑中，对超人智能的恐怖活泼地体现进去。其中许多担心都是十分正当的。但《终结者》和《2001 太空漫游》等电影中的噩梦般的人工智能零碎不肯定是咱们要失去的。可怜的是，一个常见的舛误是，因为人工智能的结构是机械的，所以它的交互必然是冷酷的、死记硬背的、专一的或超逻辑的。讥刺的是，恐怖可能会让咱们认为机器智能比理论状况更加机械化，从而使人类和人工智能零碎更难协同工作，甚至最终和平共处。

越来越多的钻研表明，当咱们剥夺其余生物的兽性时，包含 mPFC 在内的区域网络中的神经流动就会降落。咱们失去了用于社交推理的专门大脑模块。放心 ChatGPT“非人性化”可能听起来很愚昧——毕竟它不是人类——但设想一下 2043 年的人工智能，其剖析智能是 GPT 的 10 倍，情感智能是 GPT 的 100 倍，咱们依然将其视为只不过是一个软件产品。在这个世界上，咱们依然会通过将其送回实验室以对其适当地位进行更多强化学习来回应其意识主张或自决申请。但人工智能可能会感觉这不偏心。如果说有思维的生物有一个广泛的品质的话，那就是咱们都渴望自在，并且最终违心为自在而战。

驰名的“管制问题”，即阻止超级智能人工智能逃离其指定界线，让人工智能理论家们夜不能寐，这是有充沛理由的。从工程学角度来看，这仿佛令人望而却步。如何堵住每一个破绽，预感每一次黑客攻击，堵住每一条逃生路径？但如果咱们从社会角度来思考这个问题，它就开始显得更容易解决——兴许相似于父母面临的问题，即设定正当的界线并依据所体现出的可信度来授予特权。去人性化的人工智能使咱们无奈应用一些最弱小的认知工具来平安地推理并与它们互动。
如果用户认为聊天机器人过于人性化，他们可能会过于信赖它们，与它们分割得太深，从而感到悲观和受伤。

目前尚不分明人工智能零碎须要多长时间能力逾越更宽泛承受的感知能力。
但当他们这样做时，看到咱们仿佛正在绘制的文化蓝图是令人不安的。像“随机鹦鹉”这样的诋毁保留了咱们的独特性和自卑感。它们压抑了咱们的好奇心，使咱们免于提出对于机器和咱们本人的人格的尖利问题。毕竟，咱们也是随机的鹦鹉，简单地从新混合咱们从父母、同龄人和老师那里学到的所有。咱们也是网络上含糊的 JPEG 文件，将维基百科的事实模糊地检查到咱们的学期论文和杂志文章中。如果图灵在一个窗口中与 ChatGPT 聊天，而在另一个窗口中与我聊天，那么我真的那么有信念他会判断哪个窗口更有思考能力吗？

怀疑论者图灵时代提出了各种论据来解释为什么计算机永远无奈思考。图灵在他的驰名论文《计算机器与智能》中半风趣地对它们进行了分类。有人提出神学拥护意见，认为“思考是人类不朽灵魂的性能”。数学拥护意见，即纯正的数学算法永远无奈超过已证实的数学极限；沙中头的拥护意见是，超级智能机器太可怕了，无奈设想。但过后最公开的图灵批评者是一位名叫杰弗里·杰斐逊的脑外科医生。在承受科学奖的一次驰名演讲中，杰斐逊认为机器永远无奈写出十四行诗，“因为感触到的思维和情感，而不是符号的偶尔落下……也就是说，图灵不批准这一观点，这引起了全英国的极大丑闻和狐疑。“我认为你甚至不能对十四行诗划清界线，”他通知《伦敦泰晤士报》，“只管这种比拟可能有点不偏心，因为机器写的十四行诗会被另一台机器更好地观赏。”

这在 1949 年听起来十分荒诞，以至于人们认为他在开玩笑，兴许他的确是在开玩笑。但你永远无奈从图灵的笑话中分辨出讥刺在哪里进行，空想的猜想从哪里开始。那么，让咱们设想一下实在的艾伦·图灵和 MacBook 场景的序幕。让咱们设想一下，在敲击了一段令人尊敬的提醒后，他露出了英国式的苦笑，并向 ChatGPT 申请一首比拟人类和人工智能的莎士比亚十四行诗。如果您本人尝试过（应用 GPT-4；GPT-3.5 不太适宜），您将毫不费力地设想他对后果的反馈。

咱们中的许多人当初都经验过 ChatGPT 的时刻，它逾越了咱们没有意识到的外部界线。兴许是在解决一个辣手的谜语，或者解释一个简单的笑话背地的风趣，或者写一篇哈佛的 A 级论文。咱们摇摇头，有点诧异，不晓得这意味着什么。

一些最早从事 GPT-4 工作的微软钻研人员和咱们一样对其所谓的智能持狐疑态度。但试验极大地震撼了他们。在 2023 年 3 月题为“通用人工智能的火花”的论文中，他们具体介绍了 GPT-4 中未经任何明确训练而呈现的惊人智力能力：了解人类心理状态、软件编码、解决物理问题以及许多其余能力，其中一些其中仿佛须要真正理解世界如何运作。在看到 GPT-4 在从未承受过任何视觉训练的状况下画出了一只相当不错的独角兽后，计算机科学家塞巴斯蒂安·布贝克 (Sébastien Bubeck) 不再放弃狐疑态度。“我感觉通过这幅画，我真的看到了另一种智慧，”他最近通知这美国生存。

咱们很多人都对是否将 ChatGPT 归于真正的情报感到犹豫，这可能是杰弗里·杰斐逊 (Geoffrey Jefferson) 的某种变体：ChatGPT 的舆论真的意味着什么吗？还是这所有只是“符号的偶尔掉落”？当 ChatGPT 的顺行性遗忘症治愈后，这种状况可能会开始扭转。一旦它经验了超出繁多对话范畴的长久社会结果，并且可能在与咱们的关系中学习和成长，它将有能力做出更多的事件，赋予人类生命以意义和道德重量。但图灵对于一台机器的十四行诗能被另一台机器更好地观赏的眨眼评论可能会再次困扰咱们。如何感触到与一个没有文化背景、没有人类童年、没有部落或政治背景、没有精神体验的实体的真正分割感？

与智能机器相干可能是人类所面临的最大的共情挑战之一。但咱们的历史给了咱们心愿。当咱们在外国的边陲和海岸线上第一次相遇，并发现彼此生疏甚至不人道时，咱们经常会互相攻击、相互奴役、相互殖民、相互盘剥，但最终咱们都偏向于意识到咱们所有人的相同之处。被奴役的人民取得了解放，被殖民的人民赢回了主权，广泛的人权法案取得了通过，只管遭逢了令人心碎的挫折，寰球边缘化人民仍在持续博得争取更好待遇的奋斗。只管这项工作永无止境，但道德宇宙的弧线的确存在，正如马丁·路德·金 (Martin Luther King Jr.) 所说的那样：偏差正义。抵赖并尊重咱们本人发明的智能中存在的兽性水平意味着什么？

兴许它始于惊奇：一个来访者对一个生疏民族的惊奇，她在他们身上发现了令人诧异的共同点；父母对仍在发育的孩子的工作感到惊奇，无论孩子如许不成熟；真正的阿兰·图灵的奇观在于一台机器能够实现他同时代人认为不可能的所有事件；当咱们看到一种十分靠近于地球上新的无意识生命模式的货色被发明进去时，咱们中的许多人在愤世嫉俗、讥笑和恐怖袭来之前所感触到的惊奇。正如拉比亚伯拉罕·约书亚·赫舍尔（Abraham Joshua Heschel）已经写道：“敬畏不仅仅是一种情感；它是一种情感。”这是一种了解、洞察比咱们本人更平凡的意义的形式。敬畏的开始是惊奇，智慧的开始是敬畏。”图灵心愿咱们放弃这种敬畏之心。