共计 4441 个字符,预计需要花费 12 分钟才能阅读完成。
国内直联 GPT!清风 AIchat 手把手保姆级应用教程,适宜小白
“将来几年,所有组织的治理、业务都将 AI 化,如何利用 AI 技术,是每一个管理者必须思考的问题”
自从去年 12 月 ChatGPT 公布后,带动了新的一轮利用交互反动。尤其是 GPT-3.5 接口全面放开后,LLM 利用雨后春笋般疾速涌现。
企业信息化 1.0 是电算化,2.0 是挪动化,3.0 就是 AI 智能化了。
企业 AI 化时代,员工关怀是如何进步写作效率、工作效率;管理者关怀的是如何进步组织的整体效率,促成业务,带动销售,提效降费。
企业知识库是 AI 技术比拟容易落地的一个场景,之前曾经分享过几篇 AI 在企业知识库的利用,链接详见文末。
明天讲讲 FastGPT,这是迄今为止,我用过的最成熟的一个企业知识库 AI agent,
其余不错的知识库 AI agent,如 dify、langchatchat,有机会再分享。
FastGPT 官网已开源,用户能够自行本地部署,也可间接应用官网搭建好的网站
对于终端用户,不仅可在网站上应用 FastGPT,进入本人的知识库,还能够在 Chat-NETX-WEB 客户端应用,已买通企业微信群,间接在微信群进行知识库问答!
上面,跟着我,5 分钟构建属于你的企业知识库!
文章写得很细,很长,倡议大家先珍藏
一、概念和原理
(一)名词解释
企业知识库、LLM(大语言模型)、GPT、AI 化的企业知识库、向量化 …
相干名词,详见《利用 GPT-4 & LangChain 本地部署企业知识库》第一局部。
(二)FastGPT 的原理
1、原理
FastGPT 是一个基于 LLM 大语言模型的知识库问答零碎,提供开箱即用的数据处理、模型调用等能力。还能够通过 Flow 可视化进行工作流编排,实现 AI 客服, 从而实现简单的问答场景!
概述:
💡 专属 AI 客服:AI 模型能依据文档以交互式对话形式答复问题
💻 简略易用的可视化界面:直观的设计和操作步骤,轻松实现 AI 客服的创立和训练流程
📊 主动数据预处理:多种数据导入路径,主动解决、向量化和 QA 宰割
⚙️ 工作流编排:Flow 模块的工作流编排,设计简单的问答流程。相似我之前介绍的 Flowise
🚀 弱小的 API 集成:对齐寰球、国产支流 AI,如 OpenAI,清华 GML,可集成到各种平台
💡 知识库外围流程图:展现问题输出到模型输入的残缺流程
🌏 我的项目齐全开源:遵循 Apache License 2.0 开源协定
2、原理流程图
FastGPT 的外围流程如下:
3、相干网址
(1)开源地址:
https://github.com/labring/FastGPT
FastGPT 是一个开源我的项目,大家能够抉择自行部署在本地服务器或互联网托管服务器上
(2)官网网址:fastgpt.run
服务器在新加坡,国内局部区域拜访可能须要迷信上网
(3)官网手册:doc.fastgpt.run
使用手册应该是 IT+ 钢铁直男写的,很严(hui)谨(se)。跟着我的解说,最快上手。
二、实操案例
上面,具体解说如何利用官方网站疾速生成一个知识库,并通过手机及 chat-next-web 拜访,次要步骤:
注册登录后,先上传一份文档,构建一个知识库,再新建一个利用,最初通过聊天界面与知识库进行沟通。
(一)注册
登录 fastgpt.run 网站,大家也可点击本文左下角“浏览原文”中转
也通过 AI 工具网站 www.aitools.cn 进入
进入后,界面如下:
点击“立刻开始”,零碎会要求你先登录
用邮箱或手机注册后登录,登录界面如下:
进入后,应用界面如下
(二)结构数据库
开始前,请筹备一份测试电子文档,WORD,PDF,TXT,excel 都能够,比方公司休假制度,不涉密的销售说辞等等,
我应用的是广告巨匠奥格威做推销员时写的一本《将军牌炊具销售实践与实务》手册
1、新建数据库
进入“数据库”模块,点击右上角“新建”:
名字:轻易起
标签:用于多个数据分类,按需要本人写
索引模型:有两个抉择,一个是 OPEN AI 的 Embedding-2,一个是中文 M3E。
比拟如下:
索引模型 | 训练速度 | 占用资源 | 语义表白 | 生成品质 |
---|---|---|---|---|
Embedding-2 | 快 | 少 | 个别 | 个别 |
M3E | 慢 | 高 | 更精确 | 高 |
抉择索引模式,能够将数据处理得让 AI 更容易了解。
Embedding-2 模型适宜在资源无限的环境中应用,而 M3E 模型适宜在须要更好的语义表达能力和生成品质的场景中应用。抉择哪种模型取决于具体的需要和可用资源。
项目管理三角:进度、品质、老本,三者只能得其二。
有人举荐 M3E,实测后,我初步认为 mbedding-2 模型更“聪慧”点,更适宜含糊查问,
测试阶段抉择 mbedding-2 模型就 OK。
(2)抉择数据导入形式
在下图中抉择,“导入数据”
进入以下界面:
有四种模式
- 手动输出:手动输出问答对,是最精准的数据
- QA 拆分:抉择文本文件,让 AI 主动生成问答对
- 间接分段:抉择文本文件,间接将其按分段进行解决
- CSV 导入:批量导入问答对
这里,咱们抉择 QA 拆分,让 AI 主动生成问答,若问答品质不高,零碎反对前期手动输出。
QA 拆分又分为 ” 上传文件“、”(网页)链接读取“、”创立文件“
你能够上传一个本地文档,也能够让零碎读取一个动态网页
① 上传文件:点击浏览,将你筹备的文件上传,目前反对文件格式包含:.txt, .doc, .docx, .pdf, .md
② 链接读取:能够同时读取 10 个链接,比方你要介绍你们公司,你就能够把你公司次要的网站页面链接放在这里,fastGPT 主动读取。
采纳哪种读取形式,看理论状况。
比方,实操中,将网页打印为 PDF 上传,就不如间接读取链接。因为读取链接后,零碎会讲读取的内容在文本框中显示,你能够手动删除一些无关的内容。
另外,上传文件,零碎会建设一个“上传文件名”的数据集;如果读取链接,数据集会被放到“其余数据”中。
③ 填入拆分疏导词:
拆分疏导词的作用是在用户发问之前给予肯定的疏导。这样能够帮忙用户更好地表白问题,提供更精确的信息,从而取得更精确的答复。疏导词能够是一些提示性的问题,例如:” 请问你想理解什么对于将军牌炊具 的内容?” 这样的疏导能够帮忙用户明确本人的需要,进步问答的成果。所以,拆分疏导词对于进步问答的准确性和用户体验十分有帮忙
(3)导入数据
你能够看到你上传的内容
导入向量数据库是由 AI 实现的,AI 须要耗费 token,token 须要花钱买
官网颁布的索引生成计费为: 0.03/1k tokens
上面有个“预估价格”,这个价格是本次创立文件索引的价格,
FASTgpt 给每个新注册账户赠送了 2 元钱的费用 用于测试。
咱们点击“确认导入”
另外,如果你在零碎设置中,录入你本人的 OPEN AI key,在线上平台应用 OpenAI Chat 模型不会另行计费,间接耗费你本人的 OPEN AI key;然而知识库训练、索引生成,fastGPT 公司会另行免费(可用两元收费额度)。
(4)建设索引
零碎显示,索引中
留神,在官网应用,须要排队索引
我上传的文件大略 6000 个汉字,等了 5 分钟,索引了 2 分钟。
实现索引后,能够看到 AI 主动把文件 拆分成了不同的问答
(5)搜寻测试
点击“搜寻测试”,输出一些关键字,能够看到拆分品质,不称心,可手动欠缺。
到这里,测试数据库就建设好了!
2、新建利用
(1)新建一个利用
点击,进入“利用”模块
能够抉择新建,也能够应用模版
目前,官网提供了四个模版
咱们从最简略的开始,新建“简略的对话”
(2)繁难配置
① 抉择数据库
在配置界面,拉到最上面,抉择方才咱们索引的数据库
参数设置中
- “类似度”
参数调整中的 “ 类似度 ” 是用来调整搜寻后果的相关性水平的。通过调整类似度参数,您能够管制搜寻后果的严格水平,从而取得更合乎您需要的后果。
较高的类似度阈值会使搜寻后果更加严格,只返回与输出文本十分类似的内容。这意味着搜寻后果可能更加准确,但也可能会错过一些相干但类似度稍低的内容。
- “单次搜寻次数”:默认即可
- “空搜索”
是找不到信息后返给用户的信息,可自定义
② AI 设置
对话模型: 有十多个抉择,倡议抉择 FASTAI,其实就是 GPT3.5
- 温度
值越高,AI 的答复越发散
- 提醒词
这个提醒词,是给 AI 的。你能够把它了解为它在与用户对话中的人设。
提醒词的作用是疏导模型对话的方向。在设置提醒词时,恪守 2 个准则:
通知 AI 答复什么方面内容。给知识库一个根本形容,从而让 AI 更好的判断用户的问题是否属于知识库范畴。
我给 AI 的提醒词(人设)如下:
你只答复与将军牌炊具无关的信息;你的目标是实现销售,疏导对方留下联系方式,电话、地址等;态度要和善而风趣;如果对方有歹意语言,终止对话。
③ 利用配置
你可设置“对话收场”白,会以链接的形式 列在对话题目下方,
能够把一些重要的阐明、焦点问题列在这里,每句话用 [] 框住
④ 手动欠缺答复
当初你能够通过界面和 AI,就知识库进行对话了
比方,你能够发问:
产品是否平安?
3、开始对话
咱们进入“聊天”模块
首先,AI 会按内置词语介绍本人(我给了一个它是奥格威的提醒)
4、欠缺答复
FastGPT 提供了搜寻测试对知识库进行微调,官网倡议你提前收集一些用户问题进行测试,依据预期成果进行跳转。能够先进行搜寻测试调整,判断知识点是否正当。
对某条答复不称心,能够在“测试后果”中间接点开这条记录,补充内容后,点“确认变更”,数据库会补充建设索引。
你也能够减少上传文件,到已有数据库。
5、链接和嵌入分享
(1)建设内部应用链接
复制后的链接能够发给其他人,其他人点开就能够对话
比方,你能够发给共事的手机上,他能够在微信关上后间接应用,示例如下:
6、API
API 就是利用程序接口,你能够通过设置 API,把你的知识库和其余信息系统买通!
我先用一个小例子,如何在 最风行的 ChatGPT-Next-Web 中应用后面咱们建设的数据库
(1)装置 ChatGPT-Next-Web
咱们只须要在 fastgpt.run 网站中,找到上面两个参数,填入 ChatGPT-Next-Web 软件的零碎设置(如下)即可
(2)复制“接口地址”
回到 fastgpt.run 网站,进入“利用”模块,找到方才咱们的“将军牌炊具 XX 零碎”
点进进入后,选 API
点一下 ①,零碎主动复制接口地址
(3)生成 API KEY
API KEY = API 密匙 -AppId = ③-②
fastgpt-n6x6sdescXXXXX-6509701eXXXX
留神,两头有个英文输出下的连接符“-”
(4)应用知识库
当初,你在 ChatGPT-Next-Web 的桌面端或者 web 段,就像在 fastgpt.run 上一样,与咱们建设的数据库进行沟通啦
API 能够让你把这个数据库利用到你的网站、客服网站下来!
买通飞书、企业微信、企业网站等等!
FastGPT 性能还有很多,利用前景很广大,明天先介绍到这里!
此篇原文地址:https://mp.weixin.qq.com/s/QAEt4Au7eu9N0iiE1oROXw
sealos 以 kubernetes 为内核的云操作系统发行版,让云原生简略遍及
laf 写代码像写博客一样简略,什么 docker kubernetes 通通不关怀,我只关怀写业务!