关于人工智能:拥有自我意识的AIAutoGPT-|-得物技术

39次阅读

共计 5563 个字符,预计需要花费 14 分钟才能阅读完成。

1. 引言

ChatGPT 在当下曾经风行一时,作为自然语言解决模型的佼佼者,ChatGPT 的劣势在于其可能生成晦涩、连贯的对话,同时还可能了解上下文并依据上下文进行答复。针对不同的利用场景能够进行疾速定制,例如,在客服、教育、娱乐等畛域中,ChatGPT 能够作为智能助手为用户提供便捷的服务和娱乐体验。

从 GPT- 3 到 GPT-4,咱们能够看到在高级推理,输出设置,微调行为和了解更长的上下文信息等方面,ChatGPT 在一直的优化训练中曾经获得了显著的停顿。

然而针对于这种交互式的 GPT 模型,咱们更心愿看到能像电影里的人工智能,领有自我意识,能够进行自我学习和进化。不须要通过频繁的疏导和交互,咱们只须要简略提出一个指标,AI 就能自主的实现所有的执行布局和逻辑解决,并一直进行自我论证和优化,最初实现咱们提出的指标。

那么明天它来了,它就是 ChatGPT 的进化版本:AutoGPT

2. 什么是 AutoGPT?

AutoGPT 是一个实验性开源应用程序,它利用 OpenAI 的 GPT- 4 语言模型来创立齐全自主和可定制的 AI 代理。它于 2023 年 3 月 30 日由 Toran Bruce Richards 发行。

Toran 是一名游戏开发商,并创建了一家名为 Significant Gravitas 的游戏公司。

在短短的一个多月工夫里,AutoGPT 的 Git 我的项目曾经取得了超过 12 万的 star,作为 GPT-4 齐全自主运行的首批示例之一,AutoGPT 冲破了 AI 的可能性界线。

与其余 AI 工具相比,AutoGPT 是举世无双的,因为它独立运行,这意味着你不再须要操纵模型来满足你的需要。相同,你只须要写下你的指标,而后 AI 会为你实现剩下的工作。因而,AutoGPT 从根本上扭转了 AI 与人类之间的交互方式,人类不再须要施展踊跃作用,同时依然放弃与 ChatGPT 等其余 AI 应用程序雷同或更好的后果品质。

3.AutoGPT 如何工作?

AutoGPT 基于自主 AI 机制工作,其中 AI 零碎创立不同的 AI 代理来满足特定工作,其中包含:

  • 工作创立代理: 当你在 AutoGPT 上输出指标时,第一个与工作创立代理交互的 AI 代理。依据你的指标,它将创立一个工作列表以及实现这些指标的步骤,并将其发送给优先级代理。
  • 工作优先级代理: 收到工作列表后,优先级 AI 代理会确保程序正确且合乎逻辑,而后再将其发送给执行代理。
  • 工作执行代理: 实现优先级排序后,执行代理将一个接一个地实现工作。这波及利用 GPT-4、互联网和其余资源来取得后果。

上述代理之间互相通信。所以当执行代理实现所有工作,后果不现实时,它能够与工作创立代理通信,创立新的工作列表。三个代理之间的迭代循环,直到实现所有用户定义的指标。

AI 代理的行为也显示在用户界面上,将它们分为四组:思维、推理、打算、评判

  • 思维(THOUGHTS):AI 代理分享它对指标的想法。
  • 推理(REASONING):AI 代理推理如何发展并实现它的想法。
  • 打算(PLAN):AI 代理通过剖析,列举了所要实现工作的打算。
  • 评判(CRITICISM):AI 进行自我评判,纠正错误并克服任何限度问题。

通过共享此计算流程,AutoGPT 能够进行重复尝试论证,并进行针对性的优化解决,能够在没有任何用户干涉的状况下克服所遇到的所有问题。

3.AutoGPT 和 ChatGPT 的比照?

尽管底层的 LLM 模型是雷同的,然而 AutoGPT 和 ChatGPT 之间还是有不少区别。

3.1  实时洞察

ChatGPT 应用的最新 GPT-4 模型是在与 GPT-3.5 雷同的数据上训练的,该数据仅到 2021 年 9 月,你无奈应用 ChatGPT 取得实时数据信息,因为你无法访问网站和在线平台来获取信息和提取信息。

相比之下,AutoGPT 能够拜访互联网。它不仅能够上网冲浪,还能够验证起源是否非法。此外,AutoGPT 能够拜访任何平台来执行工作。例如,如果你要求 AI 钻研销售产品的前景并发送外联电子邮件,它会间接应用你的 Gmail 帐户起草并发送电子邮件。

3.2  内存治理

上下文窗口对于语言模型给出精确答案十分重要。但在像 GPT-4 这样的 LLM 中,窗口有 4000 到 8000 个令牌的限度。因而,如果要求超出限度,模型可能无奈正确遵循所有指令,或者可能偏离正切并提供不牢靠的输入。

相比之下,AutoGPT 善于短期和长期内存治理。通过应用数据库,本地 Cache 和 Redis 进行内存治理,能够存储大量上下文信息或以前的教训,让 AI 模型做出更好的决策。

3.3  图像生成

AutoGPT 可能生成图像,因为它能够应用多种图像生成引擎,默认应用 DALL-E。如果你想为你的 AI 代理启用图像生成性能,你须要拜访 DALL-E 的 API。只管是多模式输出形式,但此性能目前在 ChatGPT-4 中不可用。

3.4  文字转语音

你能够通过在命令行中键入 python -m autogpt --speak 在 AutoGPT 上启用文本到语音转换。然而每次与 AutoGPT 交互时都必须输出命令。你还能够通过将 AutoGPT 连贯到多功能 AI 语音软件 Eleven Labs,为语音增加不同的声音。

4.AutoGPT 的局限性

毫无疑问,自主性为 AI 零碎减少了一个新的维度。同时,咱们也不能漠视 AutoGPT 的局限性和危险。上面列出了你必须晓得的一些要害限度。

4.1  老本昂扬

尽管性能令人惊叹,但 AutoGPT 的实用性可能会让你悲观。因为 AutoGPT 应用低廉的 GPT-4 模型,因而即便是小工作,实现每个工作的老本也可能很高。这次要是因为 AutoGPT 在特定工作的步骤中会屡次应用 GPT-4。

4.2  常常陷入循环

用户在应用 AutoGPT 时面临的最常见问题是它陷入循环。如果这种状况继续超过几分钟,则可能意味着你必须重新启动该过程。产生这种状况是因为 AutoGPT 依赖 GPT-4 来正确定义和合成工作。因而,如果底层 LLM 返回后果不足以让 AutoGPT 采取任何口头就会呈现重复尝试的问题。

4.3  数据安全性

因为 AutoGPT 通过充沛受权,能自主运行并拜访你的零碎和互联网,例如应用你的 twitter 账号,登录 github,应用搜索引擎等,因而你的数据可能会被泄露。AutoGPT 没有平安代理,所以你在应用 AutoGPT 时必须小心,如果没有给出正确的阐明和平安指南,你不能让模型持续运行。**

5. 如何装置 AutoGPT?

与其余人工智能工具不同,AutoGPT 没有简略的注册程序来拜访其平台和性能。在开始应用 AutoGPT 之前,你必须下载各种软件以满足要求。以下是具体的步骤要求:

  • 第一步:下载必备软件

首先你须要有一个 Git 账号,同时须要装置 Python3.1.0 或者更高版本,此外你必须还能纯熟应用罕用的 shell 命令或者有 Docker 容器进行我的项目启动和配置。

  • 第二步:设置你的 OpenAI API 密钥

如果你还没有,请创立一个 OpenAI 帐户(当然如果你在国内想要创立账号不是一件简略的事件,你能够参考网上其余文章进行账号申请)。关上 OpenAI 帐户后,关上_USER – API keys_转到 API 密钥选项卡。你将看到一个用于创立密钥的选项。单击它,而后复制密钥。

  • 第三步:克隆最新版本的 AutoGPT

(1)clone 我的项目

关上命令行工具通过命令git clone https://github.com/Torantulino/Auto-GPT.git 将我的项目 clone 到本地

(2)执行装置

通过命令 cd Auto-GPT && ls -al 进入目录后,能够看到有很多的文件,其中一个文件是 requirements.txt。在此文件中,你将看到运行 AutoGPT 所需的模块。

要装置这些模块,能够应用命令pip install -r requirements.txt 进行下载安装。

(3)批改配置

通过命令vim .env.template  进行 open-api-key 的配置(批改并替换your-openai-api-key),配置实现后执行mv .env.template .env 使配置失效

其余相干的配置能够参考表格按需进行

LLM PROVIDER 能够配置 OPENAI\_API\_KEY,是否应用 AZURE
LLM MODEL SETTINGS 能够配置 openAI 提供的 token 限度,防止适度调用老本节约,默认 4000-8000
LLM MODELS LLM 底层语言模型,默认能够抉择 GPT- 4 或者 gpt-3.5-turbo
MEMORY 内存治理,能够配置 local,redis,PINECONE,MILVUS 等
IMAGE GENERATION PROVIDER 图像生成,能够配置图像大小和图像生成引擎:dalle,HUGGINGFACE,STABLE DIFFUSION WEBUI
AUDIO TO TEXT PROVIDER 语音转文字,能够配置 HUGGINGFACE
GIT Provider for repository actions github 配置,通过配置 github api key 用于拜访和治理 github
WEB BROWSING 搜索引擎治理,能够配置不同的浏览器:firefox,chrome,safari,搜索引擎:google 等受权 open api 用于拜访互联网获取信息和治理拜访深度
TTS PROVIDER 文本转语音,能够配置 MAC OS,STREAMELEMENTS,ELEVENLABS 来进行文本转语音
TWITTER API twitter 账号治理,治理配置你的 twitter 账号,配置 token 用于拜访对应的 api
AUTO-GPT – GENERAL SETTINGS AutoGPT 的一些默认配置,例如寄存目录,开关,user Agent,AI settings 等

(4)开始应用

在实现以上配置当前,就曾经实现了 AutoGPT 的根本配置,这时候就能够通过命令python -m autogpt 开启你的 AutoGPT 之旅!

从上图能够看出,AutoGPT 须要你为 AI 取一个名字[Name],一个角色定位[Role],同时你能够为它制订指标[Goals](最多 5 个指标,如果你仅有一个指标就间接回车)。

在你制订实现指标当前,AutoGPT 会进行自主思考并剖析你的指标[THOUGHTS],思考实现后开始了解并推理如何去实现这个指标[REASONING],而后开始自主拆解成具体的打算[PLAN],最初会提出评判[CRITICISM] 用以保障 AI 代理纠正错误并作出正确的决断。

实现以上的行为布局后,AutoGPT 会提醒它将要作出的指令和动作 [NEXT ACTION],外面蕴含具体执行的命令[COMMAND] 和参数 [ARGUMENTS],用户能够在此时能够对危险命令进行辨认,避免出现数据泄露等预期外的危险,这里能够通过y 或者 n 进行受权或者回绝 AutoGPT 接下来的指令动作。

AutoGPT 会通过以上步骤,进行屡次循环,因为 AutoGPT 能够存储上下文和历史教训,所以每一次都会依据反馈后果进行更深刻的思考,制订出更优的计划,最初列举他要执行的打算,重复尝试和补充,直到达到你预期的指标。

AutoGPT 会通过以上步骤,进行屡次循环,因为 AutoGPT 能够存储上下文和历史教训,所以每一次都会依据反馈后果进行更深刻的思考,制订出更优的计划,最初列举他要执行的打算,重复尝试和补充,直到达到你预期的指标。

(5)Docker 应用

当然,你也能够应用 docker 运行:

// 最简略的形式就是通过 docker-compose
docker-compose build auto-gpt
docker-compose run --rm auto-gpt

// 应用 docker 命令构建
docker build -t auto-gpt .
docker run -it --env-file=.env -v $PWD:/app auto-gpt

你能够传递额定的参数,例如,运行形式 --gpt3only--continuous模式:

// docker-compose
docker-compose run --rm auto-gpt --gpt3only --continuous

// docker 
docker run -it --env-file=.env -v $PWD:/app --rm auto-gpt --gpt3only --continuous

6. 总结

与传统的文本生成技术相比,咱们发现 AutoGPT 的能力进化令人震惊,它能够通过剖析你的指标,主动拆解成它须要执行的工作,并在执行的过程中依据已有的教训和决策一直优化欠缺和总结,同时 AutoGPT 获取信息的伎俩也十分丰盛,它能通过搜索引擎搜寻,github,网页工具等渠道下载和提炼所须要的信息,通过本地缓存,语音转化,图像生成等插件能力,最终实现你所设立的指标。这种自我意识,自我迭代和更新的状态曾经十分靠近于电影《漂泊地球》里的 moss 这种人工智能!

最初问题来了,这篇文章是 AutoGPT 主动生成的吗?

文:Leo

线下流动举荐:

工夫: 2023 年 6 月 10 日(周六)14:00-18:00主题: 得物技术沙龙总第 18 期 - 无线技术第 4 期 地点: 杭州·西湖区学院路 77 号得物杭州研发核心 12 楼培训教室(地铁 10 号线 &19 号线文三路站 G 口出)

流动亮点: 本次无线沙龙聚焦于最新的技术趋势和实际,将在杭州 / 线上为你带来四个令人期待的演讲话题,包含:《抖音创作工具 -iOS 功耗监控与优化》、《得物隐衷合规平台建设实际》、《网易云音乐 - 客户端大流量流动的日常化保障计划实际》、《得物 Android 编译优化》。置信这些话题将对你的工作和学习有所帮忙,咱们期待着与你独特探讨这些令人兴奋的技术内容!

点击报名: 无线技术沙龙

本文属得物技术原创,来源于:得物技术官网

未经得物技术许可严禁转载,否则依法追究法律责任!

正文完
 0