共计 2041 个字符,预计需要花费 6 分钟才能阅读完成。
2021 年 11 ⽉的 Microsoft Ignite,微软带来了全新的 Azure OpenAI Service,通过新的 Azure 认知服务可能拜访 OpenAI 强⼤的 GPT-3 模型。尽管微软还没有正式凋谢 Open AI Service,但 GitHub 和 OpenAI 曾经推出了基于 GPT-3 的新模型 Codex 的⼯具 – Copilot,通过它能够帮忙软件开发⼈员更⾼效地编写代码。我置信不少⼩搭档都曾经开始在 Visual Studio Code / Visual Studio 使⽤ Copilot 感触到 GPT-3 的威⼒。作为开发者,心愿微软能尽快凋谢相干⽂档,能尽快把握相干技能。为了满⾜各位要求,明天我就带⼤家进⼊ OpenAI。
GPT-3 介绍
2020 年 5 月,Open AI 发表了一篇开创性的论文,题为 Language Models Are Few-Shot Learners。他们展现了 GPT- 3 语言模型,它应用了一个具备 1750 亿个参数的神经网络。GPT-3 应用来自 CommonCrawl、WebText、维基百科和书籍语料库的数据进行训练,并在各种自然语言解决工作中体现出惊人的性能,包含翻译、问答和完形填空工作。在性能上 GPT-3 也是十分优良,超过了很多现有的模型。2020 年 7 月,也就是论文发表两个月后,OpenAI 凋谢了一个 beta API playground,大家能够通过 API 形式拜访 GPT-3 模型。
GPT-3 的⼏个次要特点
- 零 / 单 / 少样本学习 (Zero/one/few-shot learning):通常,深度学习会针对⼀组特定的类别进⾏训练和测试。如果计算机视觉中对星球⼤战中的 BB8 , R2D2 , C3PO 进⾏分类,在测试过程中就只能针对这三个类别进⾏。但在零样本学习设置中,零碎在测试时,能够使⽤不在训练内的类别(例如,⽤曼努达⼈做测试)。单 / 少样本学习 (one-shot 和 few-shot) 也是⼀个情理,在测试时,零碎会别离看到⼀个或⼏个新的类别。
- 零 / 单 / 少样本工作迁徙 (Zero/one/few-shot task transfer):这个整合了 零 / 单 / 少样本学习和多任务学习的概念。新工作(或者显示零个、⼀个或⼏个新工作的示例)能够随时执⾏,⽽不是在测试时才展现新类。例如,输⼊“I love you -> 我爱你。I miss you -> ____。”GPT-3 就能够通过单样本工作迁徙,把之前没有训练过的英语转中⽂的工作执⾏起来。
- Transformers:Transformers 是解决机器翻译问题的框架, 有⼀个简略的⽹络构造,基于⾃留神机制,不依赖于递归和卷积齐全。通过并⾏计算使 Transformer 效率⾼,须要更少的训练工夫。
- ⽣成模型 (Generative models):统计学中分类工作有两种模型 - 判断模型,⽣成模型。判断模型对给定的可察看变量和⽬标变量对的条件概率进⾏编码:p(y|x)。⽣成模型对联结概率进⾏编码:p(x,y)。⽣成模型能够“⽣成相似于现有数据的新数据”,GPT-3 模型就是应⽤⽣成模型来。
- 多任务学习 (Multitask learning):⼤少数深度学习零碎都是单任务的, 只针对特定的场景。多任务零碎克服了这⼀限度。他们受过训练,可能针对给定的输⼊解决不同的工作。例如我输⼊⼀个苹果,他能够帮我翻译成英⽂的 Apple,能够找到⼀张苹果的图⽚,也能够找到苹果的⼀些特色等。
- 半监督学习 (Semi-supervised learning):是以⽆监督的⽅式训练具备⾮常⼤数据集的模型,而后通过在较⼩的数据集中使⽤监督训练来调整模型以适应不同的工作。
通过 OpenAI API 调⽤ GPT-3
因为微软当初还没凋谢 OpenAI 的 GPT-3 性能,现阶段咱们只能通过 OpenAI 提供的 API 使⽤ GPT-3。(当然你须要有⼀个美国的电话号码来激活该性能),OpenAI 有⾮常丰盛的⽂档,以及示例,让开发者能够⾮常快上⼿使⽤ API。
▌Python 调⽤ API ⼏个必须的步骤
1. 装置 openai 库 pip install openai
- 申请 API 的密钥
- 能够通过 Notebook 测试⼀下
▌⼏个留神的点
- 模型 engine,当初针对 GPT-3 有 2 个⽐较次要的模型
- 对于⼀些示例,你能够通过拜访下方链接学习更多的应⽤场景
- 你能够通过 OpenAI 提供的 Playground 做⼀些测试
- 你能够针对⾃⼰的业务定义 GPT-3 模型,你能够通过下方链接理解更多
瞻望
GPT-3 性能强⼤,让 AI 应⽤场景更贴近理论的⽣活。我⾮常心愿微软的 OpenAI Service 能尽快凋谢,让更多的开发者能使⽤。还有当初 OpenAI GPT-3 在中⽂的⽀持还是⾮常无限的,我也寄望微软版本的服务能有更好的中⽂⽀持。
相干材料
- 理解 Azure OpenAI Service 性能,请拜访
- Azure OpenAI Service 介绍,请拜访
- OpenAI 的相干博客
Microsoft Build 2022 已正式启动报名!
立刻扫码注册大会
5 月 11 日后可预约 session
关注微软中国 MSDN 公众号理解更多