关于人工智能:是否在业务中使用大语言模型

0次阅读

共计 2167 个字符,预计需要花费 6 分钟才能阅读完成。

ChatGPT 获得了微小的胜利,在短短一个月内就取得了 1 亿用户,并激发了企业和专业人士对如何在他们的组织中利用这一工具的趣味和好奇心。

但 LLM 到底是什么,它们如何使你的企业受害? 它只是一种炒作,还是会长期存在?

在这篇文章中咱们将探讨下面这个问题并尝试解答为什么 LLM 对企业来说是一项平凡的投资,或者不是。是大炮打蚊子 还是 物尽其用?这就要看何时以及如何无效和高效地应用这个大模型了。

训练

LLM 的训练是十分低廉……然而这并不意味着每次要应用 LLM 实现特定工作时都要训练它,也不意味着你基本就不须要训练它。有很多办法能够利用 LLM 的现有常识和技能,无需从头开始训练。

LLM 可能依据单词和短语互相追随的概率生成文本。也能够通过让它“依据上下文浏览”来“模拟”这种行为。这就好比给某人一本书,而后让他们在书中找到他们认为可能有 X 问题答案的那一章。一旦读者找到这一章,他们就会浏览,而后试图向你解释他们刚刚读到的内容。

这须要某种程度上对他进行提醒,这也就是咱们常说的 prompt。网上有很多对于对于提醒教程,提醒工程以及如何为 LLM 生成良好的提醒。所以当你试图失去上下文答案时,LLM 能够很好的工作。但不要指望机器晓得所有,因为它们善于的是搁置文字,而不是论述事实。

只有当你想让机器像专业人士一样谈话时,你才须要从新训练它。

业务专业术语

所有组织和企业都有本人的行话和特定于其畛域的技术术语。例如,Jam 能够指甜甜的 Smucker 草莓果冻,但也能够指非正式播放的音乐。

这意味着不是每个人都能很容易地了解特定业务应用的语言,除非他们相熟其词汇和概念。所以对于不相熟该畛域的潜在客户或合作伙伴来说可能是一个阻碍。应用 llm 能够将技术语言翻译成更天然和可拜访的语言。

LLM 能够依据所需的格调和细节程度,应用提更简略的单词或示例来帮忙解释简单术语或概念的含意,这能够使信息对任何人都更具吸引力和可了解性。

常识图谱是在图构造中组织信息的一种形式,其中实体及其关系示意为节点和边。这使得存储和访问信息比应用传统文本格式更容易。常识图谱能够独立于任何大型语言模型 (llm) 构建,并且常识图谱也能够从 llm 的性能中受害。

要创立常识图谱,须要从数据源 (如 pdf) 中提取实体和关系,并将它们插入图数据库中。llm 能够帮忙实现这项工作,通过生成代码将数据插入到数据库中。

llm 还能够帮忙应用自然语言查问常识图谱,以简略易懂的形式解释后果。通过这种形式,用户能够应用文本与数据进行交互,并从常识图中取得事实和相干的答案。

LLM 能够从提供的上下文中应用更简略的单词或示例来帮忙解释简单术语或概念的含意

敏感数据

还记得三星的问题吧,工程师的一些秘密源代码被意外上传到 ChatGPT,

你始终感觉,这种危险仅实用于应用 OpenAI 网站上的收费 ChatGPT 界面。其实任何被称为“收费”的货色都可能以某种形式取得投资回报。比方应用你的信息来改良模型。一个略微好一些的抉择是通过 API 应用付费 LLM 服务,该服务不会应用任何敏感数据进行再训练。

显示当初就好很多了,有许多代替 ChatGPT 的办法。比方 Falcon、Llama、Palm 或其余性能与 ChatGPT 类似甚至更好的模型。咱们还能够依据本人的具体需要定制本人的模型或解决方案。

通过托管本人的 LLM,能够确保它仅用于预期目标,并且能够在未来须要时对其进行从新训练。还能够摸索通过应用这些模型生成的数据,以改良您的业务。例如,查看向模型提出的最重要的问题,能够创立更好的业务解决方案并从中获利。

有了开源的根底模型,咱们能够搭建本人的 LLM,并且随时调整训练。

局部还是全副

这里咱们以举荐零碎为例:

举荐零碎是一种基于某些规范举荐我的项目或操作的零碎。例如,Spotify 应用你的收听历史和偏好来为你创立个性化的播放列表。你能够把它设想成依据其他人的爱好举荐音乐,这可能与你的爱好相匹配。

LLM 也能够做到这一点,通过嵌入来掂量两个信息片段之间的相似性或差异性,比方一个问题和一个答案。然而如果咱们只把 LLM 简化到这个水平(只生成嵌入),那么举荐零碎不是要更简略吗,而且举荐零碎可能失去更精确的后果,须要的资源还更少。

那咱们为什么要用 LLM 来做这个呢?

找到对任何给定问题的最精确的答复,而后解释为什么它是一个好的匹配,这是举荐引擎无奈做到的。嵌入不仅能够对文本做同样的事件,还能够对任何起源做同样的事件; 从音频到图像。举荐零碎须要额定的组件来解决和标记这些类型的信息。

所以这是一种种非凡状况,咱们的举荐须要音频你和图像吗?所以在应用前须要评估要解决的问题否须要 LLM 所能提供的所有性能,或者是否能够用更传统的形式解决问题。(其实下面的音频和图像只有减少几个模型就能够了,投入远远要比应用 LLM 低很多)

如果只用了 LLM 的一少部分性能,那么必定有比他更好的更传统的解决方案

总结

LLM 不仅仅是一种炒作,它们其实是一种弱小而通用的技术,能够实现业务指标并进步客户满意度。然而 LLM 并不是灵丹妙药,应用时尤其须要须要认真布局、评估和优化,以确保其有效性和效率。

如果你打算以正确的形式将 llm 整合到业务中,记住:

https://avoid.overfit.cn/post/6280016cc99749aa827c8841e6e83da2

业余的人做业余的事

正文完
 0