关于chatgpt:又是王炸微软开源贾维斯

45次阅读

共计 868 个字符,预计需要花费 3 分钟才能阅读完成。

JARVIS,一个将 LLMs(大模型们)与 ML(机器学习)社区连接起来的零碎。

随着 ChatGPT 的诞生,泛滥大模型也如雨后春笋般涌现,包含斯坦福的 Alpaca,Meta 的 LLAMA,OpenAI 的 whisper 以及 stable-diffusion,还有清华大学开源的中文大语言模型 ChatGLM。这些大模型专一于各自的畛域,并具备杰出的工作实现能力。目前你只能用 alpaca 去生成文本,用 whisper 解决语音,stable-diffusion 生成图像。

应用 midjourney 或者 stable-diffusion 时,为了生成适合的图像,须要输出失当的 prompt(提醒词),不同的 prompt 生成进去的图像可能有微小的差别,因而许多人会先应用 chatGPT,依据形容生成 prompt,再将其输出到 midjourney 中生成图像。

而 ChatGPT 本就是作为生产力工具呈现的,如此简单的步骤在工程师眼中是不可容忍的。因而 JARVIS 应运而生。通过将各种不相干的大模型(LLM)串联在一起,去实现繁多大模型无奈实现的工作。在下图的例子中能够很分明的看到大模型能力的晋升。

如图,给 JARVIS 提出的需要是:生成一张小女孩看书的图片,并且她的姿态和提供的图片里小男孩的姿态一样。而后用语音形容这张新的图片。

这个需要因为波及到几个大模型协同工作,因而目前繁多的大模型无奈解决。而 JARVIS 会将这个需要分解成几个需要,每一个需要找到适合的大模型去解决,最终胜利实现工作。

零碎要求

  • Ubuntu 16.04 LTS
  • NVIDIA GeForce RTX 3090 * 1
  • RAM > 24GB

筹备工作

JARVIS 通过 ChatGPT 串联各个大模型,因而须要筹备 openai.key,JARVIS 会须要从huggingface 下载大模型,因而还须要筹备huggingface.cookie

我的项目形容

我的项目地址:https://github.com/microsoft/JARVIS

当有了以上资源后,就能够疾速开始你的 JARVIS 之旅了。

发问:这些图片里有几只斑马?

答复:

正文完
 0