关于人工智能:十问ChatGPT一个新的时代正拉开序幕

7次阅读

共计 6146 个字符,预计需要花费 16 分钟才能阅读完成。

导语 | 美国人工智能钻研机构 Open AI 公布了最新的大语言模型 ChatGPT,其惊艳的性能在海内外掀起了一波又一波热潮。腾讯云开发者先后公布了解读作品《算法工程师深度解构 ChatGPT 技术》、《3 小时开发 ChatGPT 微信小程序》、《对标 ChatGPT:新 AI 助手 Claude 来了》,受到各畛域开发者关注。本次,腾讯研究院资深专家、前沿科技钻研核心主任王强,将以十问十答的模式,用艰深的语言,与大家交换其最新、最受关注的问题。

01、ChatGPT 当初有多火?

2022 年 11 月 30 日,ChatGPT 横空出世,在寰球范畴内造成了热烈的探讨。依据 Similarweb 的数据,往年 1 月,均匀每天约有 1300 万独立访客应用 ChatGPT,是去年 12 月份的两倍多,累计用户超 1 亿,创下了互联网最快破亿利用的记录,超过了之前 TikTok 9 个月破亿的速度。

除了宽广用户千奇百怪的问题,引发了社交媒体的大量流传,ChatGPT 在各畛域的秀肌肉,也进一步强化了其知名度。美国宾夕法尼亚大学发现,ChatGPT 可能通过该校工商管理硕士 MBA 课程的期末考试。《天然》杂志 1 月 24 日发表,将人工智能工具列为作者的论文,不能在杂志上发表。《天然》称,作者身份意味着对作品负有责任,而人工智能工具无奈承当这样的责任。据传,ChatGPT 还胜利通过了谷歌的编程面试,拿到了年薪 18.3 万美元的 L3 工程师 offer。世界各地的网友奉献了多样化的 ChatGPT 体验案例,详见《ChatGPT 还有这种玩法?》。

02、ChatGPT 背地的核心技术?

ChatGPT 是生成式 AI 的一种模式,Gartner 将其作为《2022 年度重要策略技术趋势》的第一位。Gartner 预测,到 2025 年,生成式 AI 将占到所有生成数据的 10%,但目前这个比例还有余 1%。

ChatGPT 背地的撑持是人工智能大模型,这个技术点在去年《2022 十大数字科技前沿利用趋势》报告中做过具体的论述:以后的人工智能大多是针对特定的场景利用进行训练,生成的模型难以迁徙到其余利用,属于“小模型”的领域。整个过程不仅须要大量的手工调参,还须要给机器喂养海量的标注数据,这拉低了人工智能的研发效率,且老本较高。

大模型通常是在无标注的大数据集上,采纳自监督学习的办法进行训练。之后,在其余场景的利用中,开发者只须要对模型进行微调,或采纳大量数据进行二次训练,就能够满足新利用场景的须要。这意味着,对大模型的改良能够让所有的上游小模型受害,大幅晋升人工智能的实用场景和研发效率,因而大模型成为业界重点投入的方向,Open AI、谷歌、脸书、微软,国内的百度、阿里、腾讯、华为和智源研究院等纷纷推出超大模型。特地是 Open AI GPT 3 大模型在翻译、问答、内容生成等畛域的不俗体现,让业界看到了达成通用人工智能的心愿。以后 ChatGPT 的版本为 GPT 3.5,是在 GPT3 之上的调优,能力进一步加强。

ChatGPT 应用的核心技术之一是 Transformer。这从其全称上也能看得出来,Chat Generative Pre-trained Transformer。Transformer 技术是近几年人工智能技术最大的亮点之一,他是 Google 于 2017 年提出的一种采纳注意力机制的深度学习模型,能够按输出数据各局部重要性的不同,而调配不同的权重。Transformer 的精度和性能上都要优于之前风行的 CNN(卷积神经网络)、RNN(循环神经网络)等模型,大幅晋升了模型训练的成果,让人工智能得以在更大模型、更多数据、更强算力的根底上进一步加强能力。

此外,他还具备很强的 跨模态能力,不仅在 NLP(自然语言了解)畛域体现优异,在语音、图像方面也显示出了优异的性能。对 ChatGPT 技术原理感兴趣的开发者详见《算法工程师深度解构 ChatGPT 技术》。

03、ChatGPT 为什么能胜利?

ChatGPT 是十分胜利的一次从技术研发到工程化、再到点燃公众激情的经典案例。

  • 技术创新

Open AI 继续的钻研中,一直摸索引入新的技术路线。这次引入的强化学习办法,很好地晋升了模型的成果。在钻研中,Open AI 在模型训练中,引入了人类专家。专家一方面帮忙 ChatGPT 撰写更合乎人类习惯的答复,另一方面,也对生成的后果进行排名,通过这样的处分机制,实现模型的微调优化。

  • 组织文化

Open AI 自成立之初,就致力于打造通用 AI 的能力,并动摇的继续投入,这是 ChatGPT 胜利的一大关键因素。在这样的愿景下,吸引了一大批高水平的人才,在没有任何商业 KPI 的状况下心无旁骛地发展研发工作,最终获得了重大的冲破。

  • 反馈机制

通过用户的应用,Open AI 能够取得用户对于模型优劣和应用体验的反馈,从而造成了模型应用到体验反馈的闭环,从而进一步优化模型。此外,Open AI 还组织专门的反馈比赛,激励用户针对答复中的危险危害、新鲜的答复倡议等方面给予反馈,参赛者有机会赢取 500 美元的 API 积分,并可兑换相应奖品。

  • 我的项目策动

一个影响力出圈的技术,与其我的项目策动密不可分。ChatGPT 的问答和多轮对话模式,很好地激发了公众的激情和创造力,大家基于各自感兴趣的话题自由发挥,或风趣搞笑、或严肃认真,在朋友圈和媒体上每每刷屏。包含之前 GPT3 的推出,他写新闻、作诗、翻译、编代码等能力,也是在社会上产生了热议和探讨。这种很好地与公众互动的我的项目设计策略,也很值得咱们学习。包含之前 AlphaGo 的围棋大战、Deepmind 破解蛋白质折叠构造难题,都是很好的议题工作设置。

04、ChatGPT 是否开源?

尚未开源,目前是以 API(应用程序编程接口)调用的形式服务,目前也暂无开源打算。

Open AI 不 Open,是业界很多人诟病的中央。开源是多年来软件和互联网产业之所以蓬勃发展的外围能源之一。开源的形式能够调动寰球开发者的积极性,每个人都能够下载源代码应用,并进行优化和在社区分享。这种用全社会的力量来翻新的机制,大幅减速了技术科研攻关、产业利用的过程。

对于 ChatGPT 为何不开源,业界也有一些专家示意认可,因为人工智能技术至今为止还是一个黑盒,对于其外部的机制尚未可知,如果代码开源,很难防止该技术用于一些不利于社会和人类的方面。此外,自从 Open AI 放弃了非盈利组织的定位,承受微软等投资后,从商业化的角度思考,也会采取整体模型闭源,凋谢利用接口的形式来推广,同时也会开源少部分模型,丰盛开发者生态。

05、ChatGPT 收费吗?将来能赚钱吗?

以后,普通用户应用 ChatGPT 是收费的。

据《财产》,2022 年,OpenAI 公司的支出预计有余 3000 万美元,净亏损 5.45 亿美元。而随着 ChatGPT 的火爆,可能进一步减少其亏损,因为用户每一次调用,就会让 Open AI 付出更多的计算资源和带宽老本。

当然,Open AI 也开始了商业化的尝试,2023 年 2 月,OpenAI 发表推出付费试点订阅打算 ChatGPT Plus,定价每月 20 美元。付费版性能包含顶峰时段免排队、疾速响应以及优先取得新性能和改良等。

Open AI 预测,随着 ChatGPT 成为吸引客户的重要工具,其支出将会快速增长,预计 2023 年收入 2 亿美元,2024 年收入预计超过 10 亿美元。

此外,据报道,微软正在洽谈向 OpenAI 投资约 100 亿美元,也让其估值达到了 290 亿美元。而此前,2019 年微软曾向 OpenAI 投资 10 亿美元,为其提供了大量的资金反对和 Azure 云算力反对。

06、ChatGPT 会代替搜索引擎吗?

短期来说,不会。长期来看,有可能通过交融,造成新型的搜索引擎。

目前的 ChatGPT 给出的答案参差不齐,既能够给出很多问题的简要答案,甚至能写一篇合乎高级规划师程度的产业布局报告,但 ChatGPT 也不可避免地经常出现“不苟言笑的胡言乱语”的状况,这使得其置信度还需进一步晋升。而且 ChatGPT 目前的知识库次要还是 2021 年 9 月之前的数据,不足新数据,这也大大限度了其提供新信息的能力。而同时,Open AI 还推出了 WebGPT,它能够在网络上查找信息并提供信息起源,这将很大水平上补充 ChatGPT 的实时信息源,从而进一步优化答案。

在搜索引擎的逻辑下,选择权在用户,搜索引擎个别会给出泛滥相干后果,依据用户的点击反馈来继续优化搜寻后果。近年来,搜索引擎也始终在做后果惟一化的尝试,比方间接在搜寻框中提供惟一的答案抉择,但目前可提供惟一后果的比拟无限,且无奈发展多轮对话。

ChatGPT 的推出,给搜索引擎厂商带来了很大的触动,也启发了其打造搜寻新体验的方向。谷歌两位创始人屡次召开讨论会,以应答 ChatGPT 可能带来的颠覆搜索引擎业务的后劲。谷歌 CEO Pichai 示意,将在近期推出相似 ChatGPT 的基于人工智能的大型语言模型,一款由 LaMDA 提供反对的对话 AI 服务 Bard,让用户以“搜寻伴侣”的模式应用。微软曾经在 Bing 搜索引擎中增加了 ChatGPT 性能,并发展了小流量测试。百度也打算在 3 月推出新性能,在搜索引擎中退出相似 ChatGPT 的对话式机器人“文心一言”。

咱们也能够看看 ChatGPT 本人的答复:

07、还有哪些相似 ChatGPT 的模型和利用?

ChatGPT 是典型的 AIGC 大模型,目前国内外在文本、代码、图像、视频、3D 等畛域都涌现出相应的生成模型。

以后,ChatGPT 一个无力的竞争者是 Claude,他是 Anthropic 近期推出的生成式 Al 模型。Anthropic 由几位前 Open Al 的研究员在 2021 年创建,包含 OpenAl 前钻研副总裁 Dario Amodei、GPT-3 论文一作 Tom Brown 等人。对 Claude 背地技术感兴趣的开发者,详见《对标 ChatGPT,新 AI 助手 Claude 来了》。据《金融时报》报道,2022 年底,Google 向这家初创公司投资了约 3 亿美元。相比 ChatGPT,Anthropic 在其网站上更强调其构建“牢靠、可解释和可操纵的人工智能零碎”的工作。

腾讯的混元大模型,集 CV(计算机视觉)、NLP(自然语言了解)、多模态理解能力于一体,先后在 MSR-VTT、MSVD 等五大权威数据集榜单中登顶,实现跨模态畛域的大满贯。2022 年 5 月,腾讯“混元”AI 大模型在 CLUE(中文语言了解评测汇合)总排行榜、浏览了解、大规模常识图谱三个榜单同时登顶,一举突破三项纪录。12 月,混元推出国内首个低成本、可落地的 NLP 万亿大模型,并再次登顶自然语言了解工作榜单 CLUE。混元用千亿模型热启动,最快仅用 256 卡在一天内即可实现万亿参数大模型 HunYuan-NLP 1T 的训练,整体训练老本仅为间接冷启动训练万亿模型的 1 /8。

图片起源:红杉资本《Generative AI: A Creative New World》

08

ChatGPT 等大模型

会让咱们实现通用人工智能吗?

自从蕴含 1750 亿参数的 GPT3 从 2020 年 6 月推出以来,业界对于达成通用人工智能的探讨又进一步热了起来。正如微软 CEO 纳德拉近日在承受华尔街日报访谈时示意,GPT 的倒退不是线性的,而是指数级变动的,所以相比拟 GPT3,以后的 GPT3.5 曾经展现出更强的能力。业界广泛预测,GPT4 将在往年推出,并具备更弱小的通用能力。

但同时,咱们也须要有清晰的辨识,AI 并非万能。即 无论 AI 如何弱小,其解决的问题,也只是人类面临所有问题的很小一部分。因为事实世界中有海量的问题并不是数学问题,也就不可能通过计算来求解。目前人工智能曾经找到解决方案的问题,也只是可计算问题的一小部分。

09、ChatGPT 可能产生哪些社会或伦理问题?

ChatGPT 也面临人工智能长期以来面临的问题,如歧视等伦理问题,被滥用于欺骗、欺诈、政治辟谣、伪造身份等平安问题,以及知识产权问题。最近,OpenAI 示意,正思考在 ChatGPT 中增加模型水印,即监测模型能够辨认的非凡标记,以升高模型滥用的问题。

此外,针对公众广泛放心的失业问题,ChatGPT 在 LinkedIn 上分享了一篇帖子写道:“AI 不会取代你。一个应用 AI 的人将取代你”。

10、ChatGPT 的将来

将带来哪些改革和新机会?

ChatGPT 本人的答复,已展现出其倒退的一种典型门路,即作为人类的陪伴机器人。

但更重要的,ChatGPT 会成为将来人机交互的一个新入口,很可能扭转现有 APP 的交互方式,以更为天然的对话形式,让用户来应用软件和调用技能。例如,将来在文档编辑软件中,人们能够通过形容需要,让软件间接生成文字内容,或者生成一个图形,甚至间接进行修图等工作。在编程方面,ChatGPT 这种即时编程的形式,将改变传统的工作形式和利用交互规定,推动产业进入软件 3.0 的新阶段。

除此之外,ChatGPT 将来还能够有多样化的利用前景:

一是 当初炽热的数字人,难看的皮囊下,则须要相似 ChatGPT 这样的模型提供对话能力,能力让数字人具备乏味的灵魂,更好地陪伴和服务人。同时,该能力也能够嵌入到机器人身材内,让将来的人形机器人更聪慧,更像人。

二是 大量的 开发者能够利用 ChatGPT 这样的底层平台,在大模型根底上依据不同行业和场景进行模型调优,从而发明出各类满足用户需要的丰盛利用,从而造成对话式 AI 的生态。例如国外火爆的 Jasper,通过在 GPT3 模型上的微调,能够帮忙用户撰写营销文案,甚至有人在下面实现了一部 12 万字的小说,IBM、Airbnb、Autodesk 等大企业都是其企业用户。普通用户能够收费试用 1 万个单词的版本,之后能够 29 美元订购 2 万个单词,或用 59 美元订购生成 5 万个单词的权限。

三是 在教育、医疗、广告营销、电子商务、市场和策略征询、企业服务、编写代码等业余服务畛域,成为更为业余的人类助手,不仅能够生成内容,还能够调用各种业余能力,甚至代替局部高级的业余工作。企业服务方面,2 月 8 日,微软推出了由 ChatGPT 提供技术支持的高级 Teams 产品,ChatGPT 能够主动帮忙参会者生成会议记录,即便没有加入会议,智能回顾性能也能帮忙用户生成会议记录和要点。如果有被共事在会议中提到,ChatGPT 还能够给用户提供个性化的工夫线标记,以疾速查看分享和探讨的内容,该服务将在 6 月份每月免费 7 美元,而后在 7 月份减少到 10 美元。代码编写方面,近期特斯拉后任 AI 总监 Andrej Karpathy 走漏,当初他 80% 的代码都是由 AI 生成的(GitHub Copilot),而且有 80% 的准确率。

四是 与其余模态 AI 工具的组合式翻新,ChatGPT 同文生图、文字生成视频、甚至将来间接生成 3D 模型的工具集成,能够带来 UGC 内容的极大丰富,成为内容工业化的外围引擎。

将来,ChatGPT 与更多的 AI、云计算等信息技术的集成翻新,将发明扭转生产力曲线的工具,成为经济倒退新动力。

腾讯云开发者公众号 后盾回复 0214 领源码

你可能感兴趣的腾讯工程师作品

| 腾讯工程师解读 ChatGPT 技术「精选系列文集」

| 国民利用 QQ 如何实现高可用的订阅推送零碎

| 腾讯云开发者热门技术干货汇总

| 7 天 DAU 超亿级,《羊了个羊》技术架构降级实战

技术盲盒:前端|后端|AI 与算法|运维|工程师文化

正文完
 0