关于人工智能:Langchain的一些问题和替代选择

Langchain 因其简化大型语言模型 (llm) 的交互方面的到关注。凭借其高级的 API 能够简化将 llm 集成到各种应用程序中的过程。

然而 Langchain 乍一看仿佛是一个不便的工具，然而它有时候否更像是一个语言迷宫，而不是一个含糊其辞的解决方案。在本文中，咱们将探讨与 Langchain 相干的一些问题，并思考一些代替框架。

Langchain 的一个重要问题是它的令牌计数性能，对于小数据集来说，它的效率很低。尽管一些开发人员抉择创立本人的令牌计数函数，但也有其余解决方案能够解决这个问题。

代替解决方案:Tiktoken 是 OpenAI 开发的 Python 库，用于更无效地解决令牌计数问题。它提供了一种简略的办法来计算文本字符串中的令牌，而不须要应用像 Langchain 这样的框架来实现这项特定工作。

文档是任何框架可用性的基石，而 Langchain 因其不充沛且常常不精确的文档而受到指摘。误导性的文档可能导致开发我的项目中代价昂扬的谬误，并且还常常有 404 谬误页面。这可能与 Langchain 还在疾速倒退无关，作为疾速的版本迭代，文档的延后性能够了解，只能说心愿当前尽快欠缺吧

Langchain 的代码库因很多概念让人混同而备受批评，这使得开发人员很难了解和应用它。这种问题的一个方面是存在大量的“helper”函数，仔细检查就会发现它们实质上是规范 Python 函数的包装器。开发人员可能更喜爱提供更清晰和间接拜访外围性能的框架，而不须要简单的两头性能。

比如说这个，就是一个简略的宰割函数：

LangChain 因暗藏重要细节和行为不统一而受到批评，这可能导致生产零碎呈现意想不到的问题。例 Langchain ConversationRetrievalChain 的一个乏味的方面，它波及到输出问题的从新措辞。这种反复措辞有时会十分宽泛，甚至毁坏了对话的天然流畅性，使对话脱离了上下文。

Langchain 的另一个毛病是不足示意数据的规范办法。这种一致性的不足可能会妨碍与其余框架和工具的集成，使其在更宽泛的机器学习工具生态系统中工作具备挑战性。

是否有更好的代替计划能够提供更容易应用、可伸缩性、活动性和个性。

LlamaIndex 是一个数据框架，它能够很容易地将大型语言模型连贯到自定义数据源。它可用于存储、查问和索引数据，还提供了各种数据可视化和剖析工具。

Deepset Haystack 是另外一个开源框架，用于应用大型语言模型构建搜寻和问答应用程序。它基于 Hugging Face Transformers，提供了多种查问和了解文本数据的工具。

本文只总结了 Langchain 用户在应用中遇到的一些问题，并非所有应用过 Langchain 的人都会遇到，然而也不能保障你当前不会遇到，所以还是应该留神这些他人遇到的问题。

尽管 Langchain 对于初学者来说是一个弱小的工具，然而随着对框架的学习和了解的加深，应该意识到有更无效和间接的办法来解决高级工作。Langchain 非常适合入门，但不肯定适宜生产。

https://avoid.overfit.cn/post/9c2edab4f3874d8aad1d428d42093008

作者:Woyera

低效的令牌应用