编者按:3分钟疾速理解GPT-4,高效获取目前对于GPT-4的重点信息。话不多说,Enjoy!

作者 | 岳扬

01 GPT-4简介

说到GPT-4,可能你不晓得,在北京工夫明天凌晨OpenAI公布之前你可能曾经用过了。依据这篇Bing Blog的内容,负责搜寻和设施的微软公司副总裁 Yusuf Mehdi 指出五周前New Bing就是应用GPT-4了。那么上面简略介绍一下GPT-4。

ChatGPT是一个大型多模态模型,能够承受图像和文本输出,并生成文本输入。尽管在许多生存理论场景中不如人类,但GPT-4在各种业余和学术测试中体现出领有专业人士的程度,包含通过美国律师资格考试 Uniform Bar Exam并取得了排名前10%左右的分数。

GPT-4是基于Transformer的模型,经过训练后能够预测文档中的next token。为了进步准确性和确保GPT-4恪守行为规范,OpenAI在预训练阶段应用RLHF,同时在后训练过程中管制模型。

02 GPT-4的弱小性能

依据OpenAI GPT-4发布会以及OpenAI Blog的相干介绍,咱们能够理解GPT-4的如下体现:

  1. GPT-4可能很好的进行文本的总结和加工。可能实现一些GPT-3.5做不了的文章总结工作,比方将一段文本总结为均由G结尾字母组成的一句话,将一段文本总结成一段可能押韵的话语等。
  2. GPT-4的代码生成性能更加弱小。可能用GPT-4实现一个Discord机器人,它通过学生成伪代码,而后依据伪代码一步一步实现具体性能。
  3. GPT-4能够承受图像输出,可能要求它对图片进行形容。
  4. GPT-4生成答复的文本长度大大增加,当初能够达到32000个tokens。
  5. 可能依据人类绘制的原型图草图生成HTML。这个性能真的是太强大啦!
  6. 可能实现简单推理,比方OpenAI GPT-4发布会上用到的税务例子,他会依据你给他的税务法律等文件进行简单推理,帮你解决税务疑难。

03 GPT-4的技术路线

目前尚未颁布过多细节,基于目前笔者把握的状况,GPT-4和ChatGPT所应用的GPT3.5技术路线应该基本一致,对原理有趣味的敌人能够参考这篇对于ChatGPT的技术解析。

不过GPT-4应用了更多优质(着重强调优质)数据进行训练,以及模型的参数更大。

最近也涌现出了许多优质的开源大语言模型,咱们对此进行了整顿,供小伙伴们参考。也欢送大家继续奉献输出,一起欠缺更新列表。

Awesome Open Source LLMs 列表地址: https://github.com/BaihaiAI/IDP/blob/main/AIGC/Awesome%20LLMs%20-%20a%20list%20for%20trending%20open%20source%20LLM%20projects.md

如果感觉有帮忙,麻烦帮忙分享哦!