GitHub 新产品 Copilot 来了!这款产品由 GitHub 与 OpenAI 联合开发,目前已上线技术预览版,该工具 内嵌在 Visual Studio Code 编辑器中,可主动补全代码片段。
GitHub 示意,Copilot 不只是鹦鹉学舌般地背出以前见过的代码。它会剖析用户已编写的代码,并生成新的匹配代码,包含之前调用过的特定函数。该我的项目网站上的示例包含主动编写代码来导入推文、绘制散点图、获取 Goodreads 评分。
其次要性能包含:
- 提取代码上下文,给出整行代码或整个函数的补全倡议;
- 将正文转化为代码;
- 主动填充反复代码;
- 编写测试;
- 疾速发现解决问题的代替办法;
- 无需网络搜寻即可疾速摸索新的 API;
- 适应用户编写代码的形式,帮忙用户更快地实现工作。
GitHub 首席执行官 Nat Friedman 在博客中示意,GitHub Copilot 实用于宽泛的框架和语言,但目前公布的技术预览版对 Python、JavaScript、TypeScript、Ruby 和 Go 尤其实用。
GitHub 认为这是 成对编程的演变。成对编程即两个程序员在同一个我的项目中工作,捕获彼此的谬误并放慢开发过程,而 Copilot 将另一位程序员转换为虚构模式。
微软与 OpenAI 的携手
2019 年微软发表向 OpenAI 投资 10 亿美元,Copilot 我的项目正是这项投资的首个次要后果。OpenAI 是一家钻研公司,现由 Y Combinator 前总裁 Sam Altman 领导。自 Altman 掌权以来,OpenAI 曾经从非营利组织转向“无限盈利”(capped-profi)模式,并承受了微软的投资。2020 年 9 月,微软取得 OpenAI GPT-3 语言模型的独家许可。(GPT-3 是一个领有 1750 亿参数的自回归语言模型,在多个 NLP 数据集上展现出杰出的性能,其生成的文章甚至无奈被分别真伪。)
Copilot 基于一种叫做 OpenAI Codex 的新算法构建,并应用从 GitHub 熵提取的万亿字节公开可用代码以及英语示例进行训练。
Copilot 工作原理
Codex 被称为 GPT-3 的后辈,不同的是 GPT-3 次要生成文本,而 OpenAI Codex 生成代码。OpenAI 一名代表称,OpenAI 打算在今年夏天晚些时候通过其 API 公布 Codex 版本,以帮忙开发人员应用这项技术构建本人的应用程序。
Copilot 可能存在的问题
Copilot 带来的生产力晋升失去了大量投诉,但 GitHub 暗示并非所有代码都通过了 bug、不平安实际或集体数据的审查。GitHub 称已装置过滤器,用于避免 Copilot 生成攻击性语言,但这可能并不完满。
Copilot 网站示意:“因为底层技术的预公布性质,GitHub Copilot 有时可能会产生不受期待的输入,包含有偏见的、歧视性的、唾骂性的或触犯性的输入。”
GPT-3 模型在偏见和唾骂性语言模式方面蒙受了一些批评,但 OpenAI 仿佛尚未找到一种办法,来避免算法继承训练数据中的最差元素。OpenAI 还正告称,该模型可能会倡议电子邮件地址、API 密钥或电话号码,但这种状况很少产生,而且数据是合成的或由算法伪随机生成的。然而 Copilot 生成的代码很大水平上是原创的。GitHub 进行的一项测试发现,只有 0.1% 的生成代码与训练集中的代码重合。
Copilot 并非首个通过代码主动生成来帮忙程序员的我的项目。初创公司 Kite 推出过一个十分相似的性能,在超过 16 个代码编辑器上可用。
目前,Copilot 还处于受限的技术预览阶段,用户能够在我的项目网站上注册,取得拜访机会。
网站地址:https://copilot.github.com/
参考链接:
https://www.theverge.com/2021/6/29/22555777/github-openai-ai-tool-autocomplete-code