共计 3086 个字符,预计需要花费 8 分钟才能阅读完成。
举荐:应用 NSDT 场景编辑器
助你疾速搭建可二次编辑的 3D 利用场景
ChatGPT 与 Google Bard 之战的开始
ChatGPT 和 Google Bard 都是 AI 聊天机器人。这项技术的最简略版本曾经存在于您的智能手机上 – 您键入“好”,您的手机预测您可能想要应用的下一个单词是“晚上”。
ChatGPT 最后由 OpenAI 开发,而后由 Microsoft 投资,达到令人瞠目结舌的 10 亿美元(除了晚期的 1 亿美元投资)。谷歌对他们的搜寻垄断可能曾经完结感到有些恐慌,作为回应,他们推出了 Bard,他们的技术版本有一些缺点。在第一次现场演示中,Bard 犯了几个事实谬误。至多能够说,谷歌很难堪。
ChatGPT 和 Google Bard 比智能手机预测文本简单一些,但要理解两个 AI 聊天机器人之间的差别,这就是你须要晓得的。
让咱们更深刻地理解这两个 AI 引擎之间的技术差别。
AI 与 Bard 之间的对决:底层技术是什么?
您能够在这里疾速、轻松地理解两种引擎之间的技术差别。正是如此。如果您想要更粗疏的外观,请随时进一步滚动。
当初您曾经有了 TL;DR,让咱们更深刻地理解所有这些指标。
什么是 ChatGPT?
ChatGPT 于 30 年 2022 月 4 日忽然呈现。到 2022 年 2023 月 100 日,该服务的每日用户已超过 <> 万。<> 年 <> 月,这一数字激增至 <> 亿多用户。
它立刻流行起来的根本起因是它能够以一种听起来简直人性化的形式为您提供许多主题的牢靠回复,并且任何有互联网连贯的人都能够拜访它。
ChatGPT 由 OpenAI 创立,OpenAI 是一家位于旧金山的 AI 实验室,专一于创立敌对的 AI。聊天机器人位于 GPT-3.5 上,这是一个大型语言模型,当给定文本时,能够持续提醒。
除此之外,ChatGPT 还失去了一些额定的培训——人类培训师通过与模型交互来改良模型,并“处分”模型以取得更高质量的答案。
训练数据
GPT-3.5 是在一个微小的网络文本数据集上进行训练的,其中包含一个名为 Common Crawl 的风行数据集。常见爬网蕴含 PB 级的 Web 数据,其中蕴含原始网页数据、元数据提取和文本提取。例如,它包含来自 StrataScratch 的咱们本人的 URL 汇合。认为 ChatGPT 是应用咱们每天拜访的网站进行训练是不是很疯狂?
Common Crawl 负责 60% 的训练数据,但 GPT-3.5 也从其余起源获取数据。
什么是 Google Bard?
Bard 是 Google 对 ChatGPT 受欢迎的回应。与 ChatGPT 不同,Bard 由 Google 本人的模型 LaMDA 提供反对,LaMDA 是对话利用程序语言模型的缩写。与 ChatGPT 不同,它并不那么令人兴奋,起因很简略,大多数人还无法访问它。只管谷歌的确在二月初举办了一个充斥谬误的 Bard 演示,但当初它只提供给多数人。
谷歌的 Bard 的次要劣势是它对互联网凋谢。问 ChatGPT 总统是谁,它不晓得。这是因为训练数据在 2021 年年中左右被切断。与此同时,Bard 明天利用互联网上的信息。问问 Bard,实践上,Bard 应该可能从明天互联网上可用的数据中提取进去,通知你总统是谁。
尽管你还不能试一试,但很容易看出 Bard 如何在几个要害方面从 ChatGPT 中怀才不遇。
训练数据
首先,LaMDA 承受了对话训练,专门用于在对话中交谈,而不仅仅是像 GPT- n 模型那样生成文本。尽管 ChatGPT 毫不掩饰其训练数据,但咱们对 Bard 承受训练的数据知之甚少。
咱们能够通过查看 LaMDA 的钻研论文来推断一下。谷歌的钻研人员示意,12.5% 的训练数据来自 Common Crawl,就像 GPT- n 模型一样。另外 12.5% 来自维基百科。依据钻研论文,他们应用了 1.56 万亿字的“公共对话数据和网络文本”。
咱们晓得常见的抓取数据,显然你晓得维基百科。其余的呢?它是成心暗藏的,大略是为了爱护 Bard(和 LaMDA)免受模仿者的侵害。
LaMDA 是通过微调一系列基于 Transformer 的神经语言模型而构建的,这些模型是最后由 Google 开发的开源神经网络架构。(乏味的旁注 – GPT 也是建设在变形金刚之上的。
ChatGPT 有一些护栏来避免它变得太厌恶或胡言乱语,但谷歌曾经强调了他们如何精心创立质量保证,使 Bard 成为更好,更平安的聊天机器人。Bard 通过微调,以促成“品质、接地气和平安”。
谷歌对此有很多话要说,我倡议浏览他们对于它的博客文章,但如果你工夫紧迫,它基本上能够合成为:
- Bard 应该给出有意义的回应——没有荒诞,没有矛盾
- Bard 应该以一种好的形式给出有见地、滑稽或意想不到的回应
- Bard 应该防止任何对用户造成挫伤的危险 – 血腥,偏见,怨恨的刻板印象等等
- Bard 不应该假造货色
因为公布谬误,咱们曾经晓得谷歌还没有齐全弄清楚这个最低要求。但值得注意的是,谷歌以一种 ChatGPT 没有的形式如此分明地议论这些设计要求 – 至多当初还没有。
ChatGPT vs 谷歌 Bard:模型参数,为什么它很重要?
ChatGPT 的确比 Bard 领有更多的模型参数 – 175 亿对 137 亿。您能够将参数视为旋钮或杠杆,模型会调整这些旋钮或杠杆以适应正在训练的数据。更多的参数通常意味着模型具备更大的能力来捕捉语言中的简单关系,但它也存在适度拟合的危险。
Google Bard 可能不太灵便,但与 ChatGPT 相比,它对新语言用例的鲁棒性也可能更强。
ChatGPT vs Google Bard:他们有什么共同点?
值得强调的是,Bard 和 ChatGPT 都位于基于 Transformer 的深度学习神经网络上的模型(别离为 LaMDA 和 GPT-3.5)。
例如,Transformer 能够制作一个经过训练来浏览句子或段落的模型,留神这些单词之间的关系,而后预测它认为接下来会呈现什么单词 – 相似于智能手机的预测文本,正如我之前提到的。
我不会在这里深刻探讨杂草,但你须要晓得的是,这意味着在他们的外围,Bard 和 ChatGPT 彼此之间并没有太大的不同。
ChatGPT vs 谷歌 Bard:所有权
尽管所有权并不齐全是技术差别,但值得牢记。
Google Bard 由 Google 全资制作和领有,位于 LaMDA 之上,LaMDA 也是由 Google 创立的。
ChatGPT 由位于旧金山的 AI 钻研实验室 OpenAI 开发。OpenAI 最后是非营利性的,但它的确在 2019 年创立了一个营利性子公司。OpenAI 也是 Dall- E 的幕后推手,Dall- E 是你可能玩过的 AI 文本到图像生成。
尽管 Microsoft 在 OpenAI 上投入了大量资金,但目前它是一家独立的钻研机构。
哪个是最好的,ChatGPT 和谷歌 Bard?
很难对这个问题给出一个偏心的答案,因为它们是如此类似,但又如此不同。首先,当初简直没有人能够拜访 Google Bard。另一方面,ChatGPT 的训练数据在大概两年前就被切断了。
两者都是文本生成器 – 您提供提醒,Google Bard 和 ChatGPT 都能够答复它。两者都有数十亿个参数来微调模型。两者都有重叠的训练数据源,并且都建设在 Transformer(雷同的神经网络模型)上。
它们也是为不同的目标而设计的。Bard 将帮忙您浏览谷歌搜寻。它被设计为对话式的。ChatGPT 能够生成整个博客文章。它旨在吐出有意义的文本块。
最终,ChatGPT 和 Google Bard 之间的技术差别只是强调了 AI 驱动的文本生成技术曾经走了多远。尽管它们都有很长的路要走,并且在版权和道德方面都面临争议,但这两个生成器都是古代人工智能模型的无力演示。
原文链接:ChatGPT vs Google Bard:技术差别的比拟