乐趣区

关于云计算:FastGPT知识库AI-保姆级教程5分钟上手

国内直联 GPT!清风 AIchat 手把手保姆级应用教程,适宜小白

“将来几年,所有组织的治理、业务都将 AI 化,如何利用 AI 技术,是每一个管理者必须思考的问题”

自从去年 12 月 ChatGPT 公布后,带动了新的一轮利用交互反动。尤其是 GPT-3.5 接口全面放开后,LLM 利用雨后春笋般疾速涌现。

企业信息化 1.0 是电算化,2.0 是挪动化,3.0 就是 AI 智能化了。

企业 AI 化时代,员工关怀是如何进步写作效率、工作效率;管理者关怀的是如何进步组织的整体效率,促成业务,带动销售,提效降费。

企业知识库是 AI 技术比拟容易落地的一个场景,之前曾经分享过几篇 AI 在企业知识库的利用,链接详见文末。

明天讲讲 FastGPT,这是迄今为止,我用过的最成熟的一个企业知识库 AI agent,

其余不错的知识库 AI agent,如 dify、langchatchat,有机会再分享。

FastGPT 官网已开源,用户能够自行本地部署,也可间接应用官网搭建好的网站

对于终端用户,不仅可在网站上应用 FastGPT,进入本人的知识库,还能够在 Chat-NETX-WEB 客户端应用,已买通企业微信群,间接在微信群进行知识库问答!

上面,跟着我,5 分钟构建属于你的企业知识库!

文章写得很细,很长,倡议大家先珍藏

一、概念和原理

(一)名词解释

企业知识库、LLM(大语言模型)、GPT、AI 化的企业知识库、向量化 …

相干名词,详见《利用 GPT-4 & LangChain 本地部署企业知识库》第一局部。

(二)FastGPT 的原理

1、原理

FastGPT 是一个基于 LLM 大语言模型的知识库问答零碎,提供开箱即用的数据处理、模型调用等能力。还能够通过 Flow 可视化进行工作流编排,实现 AI 客服, 从而实现简单的问答场景!

概述:

💡 专属 AI 客服:AI 模型能依据文档以交互式对话形式答复问题

💻 简略易用的可视化界面:直观的设计和操作步骤,轻松实现 AI 客服的创立和训练流程

📊 主动数据预处理:多种数据导入路径,主动解决、向量化和 QA 宰割

⚙️ 工作流编排:Flow 模块的工作流编排,设计简单的问答流程。相似我之前介绍的 Flowise

🚀 弱小的 API 集成:对齐寰球、国产支流 AI,如 OpenAI,清华 GML,可集成到各种平台

💡 知识库外围流程图:展现问题输出到模型输入的残缺流程

🌏 我的项目齐全开源:遵循 Apache License 2.0 开源协定

2、原理流程图

FastGPT 的外围流程如下:

3、相干网址

(1)开源地址:

https://github.com/labring/FastGPT

FastGPT 是一个开源我的项目,大家能够抉择自行部署在本地服务器或互联网托管服务器上

(2)官网网址:fastgpt.run

服务器在新加坡,国内局部区域拜访可能须要迷信上网

(3)官网手册:doc.fastgpt.run

使用手册应该是 IT+ 钢铁直男写的,很严(hui)谨(se)。跟着我的解说,最快上手。

二、实操案例

上面,具体解说如何利用官方网站疾速生成一个知识库,并通过手机及 chat-next-web 拜访,次要步骤:

注册登录后,先上传一份文档,构建一个知识库,再新建一个利用,最初通过聊天界面与知识库进行沟通。

(一)注册

登录 fastgpt.run 网站,大家也可点击本文左下角“浏览原文”中转

也通过 AI 工具网站 www.aitools.cn 进入

进入后,界面如下:

点击“立刻开始”,零碎会要求你先登录

用邮箱或手机注册后登录,登录界面如下:

进入后,应用界面如下

(二)结构数据库

开始前,请筹备一份测试电子文档,WORD,PDF,TXT,excel 都能够,比方公司休假制度,不涉密的销售说辞等等,

我应用的是广告巨匠奥格威做推销员时写的一本《将军牌炊具销售实践与实务》手册

1、新建数据库

进入“数据库”模块,点击右上角“新建”:

名字:轻易起

标签:用于多个数据分类,按需要本人写

索引模型:有两个抉择,一个是 OPEN AI 的 Embedding-2,一个是中文 M3E。

比拟如下:

索引模型 训练速度 占用资源 语义表白 生成品质
Embedding-2 个别 个别
M3E 更精确

抉择索引模式,能够将数据处理得让 AI 更容易了解。

Embedding-2 模型适宜在资源无限的环境中应用,而 M3E 模型适宜在须要更好的语义表达能力和生成品质的场景中应用。抉择哪种模型取决于具体的需要和可用资源。

项目管理三角:进度、品质、老本,三者只能得其二。

有人举荐 M3E,实测后,我初步认为 mbedding-2 模型更“聪慧”点,更适宜含糊查问,

测试阶段抉择 mbedding-2 模型就 OK。

(2)抉择数据导入形式

在下图中抉择,“导入数据”

进入以下界面:

有四种模式

  • 手动输出:手动输出问答对,是最精准的数据
  • QA 拆分:抉择文本文件,让 AI 主动生成问答对
  • 间接分段:抉择文本文件,间接将其按分段进行解决
  • CSV 导入:批量导入问答对

这里,咱们抉择 QA 拆分,让 AI 主动生成问答,若问答品质不高,零碎反对前期手动输出。

QA 拆分又分为 ” 上传文件“、”(网页)链接读取“、”创立文件“

你能够上传一个本地文档,也能够让零碎读取一个动态网页

① 上传文件:点击浏览,将你筹备的文件上传,目前反对文件格式包含:.txt, .doc, .docx, .pdf, .md

② 链接读取:能够同时读取 10 个链接,比方你要介绍你们公司,你就能够把你公司次要的网站页面链接放在这里,fastGPT 主动读取。

采纳哪种读取形式,看理论状况。

比方,实操中,将网页打印为 PDF 上传,就不如间接读取链接。因为读取链接后,零碎会讲读取的内容在文本框中显示,你能够手动删除一些无关的内容。

另外,上传文件,零碎会建设一个“上传文件名”的数据集;如果读取链接,数据集会被放到“其余数据”中。

③ 填入拆分疏导词

拆分疏导词的作用是在用户发问之前给予肯定的疏导。这样能够帮忙用户更好地表白问题,提供更精确的信息,从而取得更精确的答复。疏导词能够是一些提示性的问题,例如:” 请问你想理解什么对于将军牌炊具 的内容?” 这样的疏导能够帮忙用户明确本人的需要,进步问答的成果。所以,拆分疏导词对于进步问答的准确性和用户体验十分有帮忙

(3)导入数据

你能够看到你上传的内容

导入向量数据库是由 AI 实现的,AI 须要耗费 token,token 须要花钱买

官网颁布的索引生成计费为: 0.03/1k tokens

上面有个“预估价格”,这个价格是本次创立文件索引的价格,

FASTgpt 给每个新注册账户赠送了 2 元钱的费用 用于测试。

咱们点击“确认导入”

另外,如果你在零碎设置中,录入你本人的 OPEN AI key,在线上平台应用 OpenAI Chat 模型不会另行计费,间接耗费你本人的 OPEN AI key;然而知识库训练、索引生成,fastGPT 公司会另行免费(可用两元收费额度)。

(4)建设索引

零碎显示,索引中

留神,在官网应用,须要排队索引

我上传的文件大略 6000 个汉字,等了 5 分钟,索引了 2 分钟。

实现索引后,能够看到 AI 主动把文件 拆分成了不同的问答

(5)搜寻测试

点击“搜寻测试”,输出一些关键字,能够看到拆分品质,不称心,可手动欠缺。

到这里,测试数据库就建设好了!

2、新建利用

(1)新建一个利用

点击,进入“利用”模块

能够抉择新建,也能够应用模版

目前,官网提供了四个模版

咱们从最简略的开始,新建“简略的对话”

(2)繁难配置

① 抉择数据库

在配置界面,拉到最上面,抉择方才咱们索引的数据库

参数设置中

  • “类似度”

参数调整中的 “ 类似度 ” 是用来调整搜寻后果的相关性水平的。通过调整类似度参数,您能够管制搜寻后果的严格水平,从而取得更合乎您需要的后果。

较高的类似度阈值会使搜寻后果更加严格,只返回与输出文本十分类似的内容。这意味着搜寻后果可能更加准确,但也可能会错过一些相干但类似度稍低的内容。

  • “单次搜寻次数”:默认即可
  • “空搜索”

是找不到信息后返给用户的信息,可自定义

② AI 设置

对话模型: 有十多个抉择,倡议抉择 FASTAI,其实就是 GPT3.5

  • 温度

值越高,AI 的答复越发散

  • 提醒词

这个提醒词,是给 AI 的。你能够把它了解为它在与用户对话中的人设。

提醒词的作用是疏导模型对话的方向。在设置提醒词时,恪守 2 个准则:

通知 AI 答复什么方面内容。给知识库一个根本形容,从而让 AI 更好的判断用户的问题是否属于知识库范畴。

我给 AI 的提醒词(人设)如下:

你只答复与将军牌炊具无关的信息;你的目标是实现销售,疏导对方留下联系方式,电话、地址等;态度要和善而风趣;如果对方有歹意语言,终止对话。

③ 利用配置

你可设置“对话收场”白,会以链接的形式 列在对话题目下方,

能够把一些重要的阐明、焦点问题列在这里,每句话用 [] 框住

④ 手动欠缺答复

当初你能够通过界面和 AI,就知识库进行对话了

比方,你能够发问:

产品是否平安?

3、开始对话

咱们进入“聊天”模块

首先,AI 会按内置词语介绍本人(我给了一个它是奥格威的提醒)

4、欠缺答复

FastGPT 提供了搜寻测试对知识库进行微调,官网倡议你提前收集一些用户问题进行测试,依据预期成果进行跳转。能够先进行搜寻测试调整,判断知识点是否正当。

对某条答复不称心,能够在“测试后果”中间接点开这条记录,补充内容后,点“确认变更”,数据库会补充建设索引。

你也能够减少上传文件,到已有数据库。

5、链接和嵌入分享

(1)建设内部应用链接

复制后的链接能够发给其他人,其他人点开就能够对话

比方,你能够发给共事的手机上,他能够在微信关上后间接应用,示例如下:

6、API

API 就是利用程序接口,你能够通过设置 API,把你的知识库和其余信息系统买通!

我先用一个小例子,如何在 最风行的 ChatGPT-Next-Web 中应用后面咱们建设的数据库

(1)装置 ChatGPT-Next-Web

咱们只须要在 fastgpt.run 网站中,找到上面两个参数,填入 ChatGPT-Next-Web 软件的零碎设置(如下)即可

(2)复制“接口地址”

回到 fastgpt.run 网站,进入“利用”模块,找到方才咱们的“将军牌炊具 XX 零碎”

点进进入后,选 API

点一下 ①,零碎主动复制接口地址

(3)生成 API KEY

API KEY = API 密匙 -AppId = ③-②

fastgpt-n6x6sdescXXXXX-6509701eXXXX

留神,两头有个英文输出下的连接符“-”

(4)应用知识库

当初,你在 ChatGPT-Next-Web 的桌面端或者 web 段,就像在 fastgpt.run 上一样,与咱们建设的数据库进行沟通啦

API 能够让你把这个数据库利用到你的网站、客服网站下来!

买通飞书、企业微信、企业网站等等!

FastGPT 性能还有很多,利用前景很广大,明天先介绍到这里!

此篇原文地址:https://mp.weixin.qq.com/s/QAEt4Au7eu9N0iiE1oROXw

sealos 以 kubernetes 为内核的云操作系统发行版,让云原生简略遍及

laf 写代码像写博客一样简略,什么 docker kubernetes 通通不关怀,我只关怀写业务!

退出移动版