共计 3410 个字符,预计需要花费 9 分钟才能阅读完成。
本文介绍赫赫有名的 OpenAI!概述其倒退历程,并介绍几款曾经理论落地的 AI 利用:GPT3、CLIP、DALL·E 2、Whisper、Codex、ChatGPT。
💡 作者:韩信子 @ShowMeAI
📘 深度学习实战系列:https://www.showmeai.tech/tutorials/42
📘 本文地址:https://www.showmeai.tech/article-detail/414
📢 申明:版权所有,转载请分割平台与作者并注明出处
📢 珍藏 ShowMeAI 查看更多精彩内容
💡 简介
AI 以迅速的倒退,不仅仅在钻研界带来了变革,在生存的方方面面也提供智能化,使咱们更便当。在本篇内容中,ShowMeAI 将介绍 OpenAI 的次要倒退以及它们理论落地的 AI 产品利用。
💡 OpenAI vs DeepMind,两大人工智能巨头应答不同挑战
OpenAI 的使命侧重于以平安的形式为全人类实现人工智能的可用性。OpenAI 的模型为数据提取、文本生成、语音辨认、图像生成或编辑等日常工作带来了高效的解决方案。只管它们的工作和指标不同,但它们在开发大型模型方面有着独特的致力,这些模型在当今的大多数利用中都施展着要害的作用。
DeepMind 的使命是解决智能问题,推动迷信倒退并造福人类。因而,它强调通用智能,即 AI 在任何状况下都可能自行学习。这也解释了为什么 DeepMind 所有的冲破都依赖于深度强化学习,即 AI 只有一个指标和一组可能的口头,须要找出实现该指标的最佳办法。
💡 GPT3,超智能化的内容生成助手
💦 GPT3 介绍
📘GPT-3 是一种深度学习模型,该模型经过训练后能够预测序列中的下一个标记,并能生成晦涩真切的文本,笼罩文本剖析和摘要、文案撰写、代码生成等利用场景。GPT-3 在公布后不久就掀起了寰球的热潮,促成了大量应用程序和初创公司的诞生。下图为用户应用“Grammar Correction”开始编程的操作示例。
💦 现实生活中的利用
OpenAI 官网示意,OpenAI API 是公司第一个商业产品,自推出九个月以来,超过 300 个利用在应用 GPT-3,成千上万的开发人员在应用平台。目前均匀每天生成 45 亿个单词,且生产流量持续扩充中。
如果你须要在线的文本解决方案,那能够浏览更多相干信息并本人把模型玩起来:https://beta.openai.com/playground。OpenAI 为所有新帐户提供 18 美元的信用额度。
💡 CLIP,文本和图像的人造交融艺术
💦 CLIP 介绍
📘CLIP 是 OpenAI 开发的一种大型预训练语言模型,将输出的文本映射到一个间断的向量空间,并通过计算两个文本之间的间隔来进行文本分类和类似度计算。与传统的语言模型不同,CLIP 能够通过学习数据库中的大量文本数据来实现端到端的文本分类,而不须要任何人工标注。因而,它能够用于许多不同的文本分类工作,包含情感剖析、常识图谱构建和图像标注。下图表明 CLIP 极大地改良了图像分类的后果!
💦 现实生活中的利用
CLIP 能够实现零样本图像分类、图像形容、内容审核、图像生成等。值得注意的是,CLIP 是 DALLE 的构建块之一。
💡 DALL·E 2,优良的艺术家
💦 DALL·E 2 介绍
📘DALL·E 2 是 OpenAI 公司研发的一款新的人工智能零碎,不仅能够依据文本形容生成对应的真切图像,还能够依据文本提醒批改图像内容,以及依据给定的图像拓展生成多种主题格调统一的“变体”。目前公开可用,能够间接拜访 OpenAI 网站,也能够调用 API(2022 年 11 月曾经公布!)。
💦 现实生活中的利用
DALL·E 2 的影响力可与 GPT3 媲美,利用场景也十分丰盛,包含插图、图像摄影、NFT 生成、图像编辑等。微软曾经发表 DALL·E 2 将为其 Designer App 提供反对;Shutterstock 还发表与 OpenAI 建设单干关系,容许用户在平台上应用 DALL·E 2 进行创作!
💡 Whisper,听懂所有语言的智者
💦 Whisper 介绍
📘Whisper 是一个主动语音辨认 (ASR) 零碎。它应用从网络上收集的 680,000 小时多语言和多任务监督数据进行训练。应用如此宏大且多样化的数据集能够进步对口音、背景乐音和技术语言的鲁棒性。此外,它还反对多种语言的转录,以及将这些语言翻译成英语。
💦 现实生活中的利用
Whisper 是收费和可编程的,应用体验令人兴奋!这也使其成为现有商业语音辨认服务的无力竞争者。它也可能间接挑战了以后支流的“基于云的 ASR 服务”。
因为 Whisper 模型较小,便于本地运行的挪动 App 应用,从而能够防止转录前数据上传云端导致的隐衷问题(曾经有人口头起来了 📘例如下方推文)。
💡 Codex,完满代码生成助手
💦 Codex 介绍
📘OpenAI Codex 是一种基于 GPT-3 的自然语言到代码零碎,有助于将 自然语言指令转换为十几种风行的编码语言。Codex 于去年 8 月通过 OpenAI 的 API 公布,是 GitHub Copilot 的次要构建块。
其实,能够要求 GPT3 解释一段简略的文本代码,从代码到解释性文本这个过程 GPT3 也能够做得很好,了解和生成代码的能力曾经编码在 GPT3 中。而 Codex 专一于生成可执行代码,使其成为开发人员的绝佳助手。因为它曾经集成到 Visual Studio 中,依据教训,将它无缝集成到开发周期中。
💦 现实生活中的利用
许多利用曾经呈现,包含各种代码助手 copilot、pygma 和 replit 等。
- Copilot 编码助手可能依据批示生成代码、将正文转换为代码、生成测试并提出备选计划。
- Pygma 应用 Codex 将 Figma 设计转换为高质量代码。
- Replit 应用 Codex 形容选定的一段代码的作用,以便每个人都能了解其性能。
下图为 Replit 依附 Codex 来解释局部代码。
💡 ChatGPT,令人兴奋的 AI 聊天机器人
💦 ChatGPT 介绍
📘ChatGPT 是 OpenAI 于 11 月 30 日推出的一款聊天机器人,能依据用户的提醒,在对话中生成相似人类的文本响应,实现答复问题、提供信息或参加对话等各种工作。与许多应用预约义的响应或规定生成文本的聊天机器人不同,ChatGPT 通过了训练,能够依据接管到的输出生成响应,从而生成更天然、更多样化的响应。
ChatGPT 的亮点次要有哪些?
- 新增代码了解和生成能力,对输出的理解能力和容纳度高,能在绝大部分常识畛域给出业余答复。
- 退出道德准则。即 ChatGPT 可能辨认歹意信息,辨认后回绝给出无效答复。
- 反对间断对话。ChatGPT 具备记忆能力,进步了模型的交互体验。
💦 现实生活中的利用
ChatGPT 不仅会聊天,写得了代码,修复得了 bug,还能帮你写工作周报、写小说、进行考试答题,绘画,看病,甚至你还能够诱骗它布局如何覆灭人类,许多人认为,ChatGPT 不仅仅是一个聊天机器人,而可能是现有搜索引擎的颠覆者。
参考资料
- 📘 GPT-3:https://openai.com/blog/gpt-3-apps/
- 📘 CLIP:https://openai.com/blog/clip/
- 📘 DALL·E 2:https://openai.com/dall-e-2/
- 📘 Whisper:https://openai.com/blog/whisper/
- 📘 OpenAI Codex:https://openai.com/blog/codex-apps/
- 📘 ChatGPT
举荐浏览
- 🌍 数据分析实战系列 :https://www.showmeai.tech/tutorials/40
- 🌍 机器学习数据分析实战系列 :https://www.showmeai.tech/tutorials/41
- 🌍 深度学习数据分析实战系列 :https://www.showmeai.tech/tutorials/42
- 🌍 TensorFlow 数据分析实战系列 :https://www.showmeai.tech/tutorials/43
- 🌍 PyTorch 数据分析实战系列 :https://www.showmeai.tech/tutorials/44
- 🌍 NLP 实战数据分析实战系列 :https://www.showmeai.tech/tutorials/45
- 🌍 CV 实战数据分析实战系列 :https://www.showmeai.tech/tutorials/46
- 🌍 AI 面试题库系列 :https://www.showmeai.tech/tutorials/48