共计 1516 个字符,预计需要花费 4 分钟才能阅读完成。
就在昨天凌晨,OpenAI 公布了多模态预训练大模型 GPT-4。
这不昨天一沉睡来,GPT- 4 都快刷屏了,不论是在朋友圈还是网络上都看到了很多信息和文章。
GPT 是 Generative Pre-trained Transformer 的缩写,也即生成型预训练变换模型的意思。
OpenAI 在布告中写道,GPT- 4 是一个多模态大模型,也是 OpenAI 致力扩大深度学习最新的里程碑。
OpenAI 的 CEO 也说这是他们到目前为止性能最弱小的模型。
置信这两天大家在网络上看到的信息比拟多也比拟杂,对于 GPT-4,咱们这里也 总结了几个比拟要害的点。
1、反对视觉输出
GPT- 4 领有多模态能力,当初能够承受图像输出并了解图像内容,这也是这次公布比拟有吸引力的一个点。
比方官网给出了一个示例,给出一幅图,手套掉下去会怎么样?
GPT- 4 能够了解并输入给到:它会掉到木板上,并且球会被弹飞。
再比方给 GPT- 4 一个长相奇怪的充电器图片,问为什么这很可笑?
GPT- 4 答复道,VGA 线充 iPhone。
另外 GPT- 4 也能够辨认与解析图片内容,比方间接将论文截图后丢给 GPT-4,它就能够主动对其进行了解和剖析。
用户甚至还能够间接画一个网站草图拍照丢给 GPT-4,它就能够立马帮忙生成代码。
2、文字输出限度晋升
GPT- 4 的文字输出限度进一步晋升,得益于此,GPT- 4 的实用性也进一步扩大。比方发布会直播上 OpenAI 总裁现场演示了一波 GPT- 4 给代码修 Bug。
用户能够间接把万字的程序文档丢给 GPT- 4 等着解决办法。
3、性能晋升
在失常的对话过程中,对于 GPT-3.5 和 GPT- 4 之间的区别感知可能很奥妙,然而当解决一些简单输出时 GPT- 4 的劣势会更显著。
团队示意,GPT- 4 在各种业余测试和学术基准上的体现与人类程度相当,其中一个数据就是它通过了模仿律师考试,且分数在应试者的前 10% 左右,而此前公布的 GPT-3.5,则处于倒数 10% 的行列。
OpenAI 也在那些为机器学习模型设计的传统基准上评估了 GPT-4。从试验后果来看,GPT-4 大大优于现有的大型语言模型,以及大多数 SOTA 模型。
4、仍然有限制性
只管这次公布的 GPT- 4 体现出了很弱小的能力,然而官网仍然示意 GPT- 4 与晚期的 GPT 模型具备类似的局限性,并不是相对牢靠。
官网示意应用这些语言模型时还是要审慎审查其输入内容,必要时应用与特定用例的需要相匹配的确切协定(例如人工审查、附加上下文或完全避免高风险场景下的应用)。
GPT- 4 依然可能会产生幻觉、生成谬误答案,并呈现推理谬误,所以团队这也是提前给打了一个预防针。
尽管这依然是一个问题,但 GPT- 4 相较于于以前的模型显著缩小了“幻觉”。在外部的对抗性真实性评估中,GPT- 4 的得分比最新的 GPT-3.5 高 40%。
5、对于应用
聊了这么多,普通用户要想应用上 GPT- 4 预计还要再等等。
目前是只有 ChatGPT Plus 付费订阅会员才能够试用 GPT-4,且试用阶段每四小时最多发 100 条信息。
而且目前来说,用户仍然只能收回纯文本信息,像图像等一些视觉输出性能预计后续才会放开应用。
目前 OpenAI 仅仅是凋谢了 GPT-4 API 的申请通道。
用户如果想要应用的话,能够先提申请加入 waitlist 列表期待通过。
6、对于 GPT- 4 论文
对于 GPT- 4 公布的细节和技术,官网也给出了一个 pdf 版本的具体技术报告,有趣味的小伙伴能够自行查看。
总而言之,这两天看到太多无关 GPT- 4 的信息,不晓得为啥心里总有一种说不出来的感觉。
我不晓得怎么样去形容这种感触,然而我想起来之前发的一篇文章评论区一位小伙伴的留言:
“忽然感觉向将来迈出了一步是怎么回事”
好了,明天的分享就先到这里吧,咱们下期见。