共计 1370 个字符,预计需要花费 4 分钟才能阅读完成。
Langchain 因其简化大型语言模型 (llm) 的交互方面的到关注。凭借其高级的 API 能够简化将 llm 集成到各种应用程序中的过程。
然而 Langchain 乍一看仿佛是一个不便的工具,然而它有时候否更像是一个语言迷宫,而不是一个含糊其辞的解决方案。在本文中,咱们将探讨与 Langchain 相干的一些问题,并思考一些代替框架。
低效的令牌应用
Langchain 的一个重要问题是它的令牌计数性能,对于小数据集来说,它的效率很低。尽管一些开发人员抉择创立本人的令牌计数函数,但也有其余解决方案能够解决这个问题。
代替解决方案:Tiktoken 是 OpenAI 开发的 Python 库,用于更无效地解决令牌计数问题。它提供了一种简略的办法来计算文本字符串中的令牌,而不须要应用像 Langchain 这样的框架来实现这项特定工作。
文档的问题
文档是任何框架可用性的基石,而 Langchain 因其不充沛且常常不精确的文档而受到指摘。误导性的文档可能导致开发我的项目中代价昂扬的谬误,并且还常常有 404 谬误页面。这可能与 Langchain 还在疾速倒退无关,作为疾速的版本迭代,文档的延后性能够了解,只能说心愿当前尽快欠缺吧
太多概念容易混同,过多的“辅助”函数
Langchain 的代码库因很多概念让人混同而备受批评,这使得开发人员很难了解和应用它。这种问题的一个方面是存在大量的“helper”函数,仔细检查就会发现它们实质上是规范 Python 函数的包装器。开发人员可能更喜爱提供更清晰和间接拜访外围性能的框架,而不须要简单的两头性能。
比如说这个,就是一个简略的宰割函数:
行为不统一并且暗藏细节
LangChain 因暗藏重要细节和行为不统一而受到批评,这可能导致生产零碎呈现意想不到的问题。例 Langchain ConversationRetrievalChain 的一个乏味的方面,它波及到输出问题的从新措辞。这种反复措辞有时会十分宽泛,甚至毁坏了对话的天然流畅性,使对话脱离了上下文。
不足规范的可互操作数据类型
Langchain 的另一个毛病是不足示意数据的规范办法。这种一致性的不足可能会妨碍与其余框架和工具的集成,使其在更宽泛的机器学习工具生态系统中工作具备挑战性。
一些替代选择
是否有更好的代替计划能够提供更容易应用、可伸缩性、活动性和个性。
LlamaIndex 是一个数据框架,它能够很容易地将大型语言模型连贯到自定义数据源。它可用于存储、查问和索引数据,还提供了各种数据可视化和剖析工具。
Deepset Haystack 是另外一个开源框架,用于应用大型语言模型构建搜寻和问答应用程序。它基于 Hugging Face Transformers,提供了多种查问和了解文本数据的工具。
总结
本文只总结了 Langchain 用户在应用中遇到的一些问题,并非所有应用过 Langchain 的人都会遇到,然而也不能保障你当前不会遇到,所以还是应该留神这些他人遇到的问题。
尽管 Langchain 对于初学者来说是一个弱小的工具,然而随着对框架的学习和了解的加深,应该意识到有更无效和间接的办法来解决高级工作。Langchain 非常适合入门,但不肯定适宜生产。
https://avoid.overfit.cn/post/9c2edab4f3874d8aad1d428d42093008
作者:Woyera