关于机器学习:Github-Copilot-值得购买吗使用GitHub-Copilot进行快速EDA的示例

46次阅读

共计 1938 个字符,预计需要花费 5 分钟才能阅读完成。

通过几个月的测试 GitHub Copilot 终于开始免费了,每月 10 美元到底值不值呢,我想通过本篇文章作为例子来演示如何将 Copilot 用于探索性剖析。心愿这篇文章能成为一些新初学者的指南,因为在我看来 Copilot 确实让编程体验更好! 最初我也会写一些我的认识,至于买还是不买还是要看你的抉择

本文基于作为数据分析师 / 数据科学家应用 python vs code 的编码教训来进行演示

简介

让咱们首先理解一些对于 GitHub Copilot 的内容。这是 GitHub 和 OpenAI 的单干成绩。Copilot 是一种基于人类程序员编写的数十亿行代码训练的语言模型。,Copilot 可能生成多种语言的计算机代码。例如,你能够输出“编写一个函数来反转二叉搜寻树”,它能够主动实现。并且它与以下 IDE 兼容:

数据集概述

咱们抉择的数据集是从 UCL 机器学习存储库下载。它包含依据墨西哥、秘鲁和哥伦比亚国家的集体的饮食习惯和身体状况预计瘦削程度的数据(Fabio 等人,2019 年)。

我发现应用 copilot 非常简单。正如在上面看到的,每次输出内容或到下一行时,Copilot 都会开始生成灰色代码。大部分工夫,只需点击 Tab 或 Enter,就能够主动填充代码。

上面是应用 Copilot 导入数据集并疾速查看的示例。它能够帮忙咱们制作丑陋的图表。输出正文:

## nobesity is the dependent variable
## check distribution of nobesity

点击 tab,而后看着它生成其余部分:

Copilot 不仅领有编程常识。它还具备无关世界的个别常识。在上面的这段代码中输出:

## calculating body index (BMI)

在代码中正确实现了 BMI 公式!不仅如此,还能够应用 Copilot 的倡议绘制分布图和热图。输出:

## plot all variables

## get corr

进一步的剖析

让咱们尝试应用 lambda 函数来编码一些分类变量。Copilot 能够为此生成简直精确的代码。然而必须进行一些调整,例如将“Yes”更改为“yes”。这里我不能确定这是 Copilot 自身的问题还是我给出的阐明的问题,因为是训练的起因可能是很多人的代码写的不太雷同吧,也可能须要指定字符串应该如何格式化。

Copilot 是对性别特地敏感。在任何单元格中输出“性别”,就不再提供任何倡议!这必定是为了所谓的 P.C,所以 Copilot 工作时,须要防止应用“性别”等这些比拟敏感的词。

当初,来剖析一下瘦削人群与 high_cal、fam_his 的关系:

## sum of high_cal and fam_his across different obesity groups

Copilot 提供了咱们须要的代码。它还为咱们提供了代码来绘制这些后果。这相似于上面的代码段。

咱们日常的 EDA 工作都能够不便的实现,所以在最初我尝试了一些不太正式的货色:

## best way to plot BMI and age and obesity group

能够看到一个十分丰富多彩且可解释的散点图(见上图)。这表明写一个信息量不大的评论,依然能够给咱们精确的后果。

应用总结

Copilot 能够生成有用的短代码片段。它还能够生成几行高质量的代码。尽管它并不完满但它的确帮忙我从某个中央开始。每天都应用 Copilot 确实能够节省时间。因为咱们不再须要破费太多工夫来寻找诸如“如何在多个列上应用 .agg”之类的的答案,咱们只有写好正文就好,那么咱们须要它花钱吗?

Github Copilot 值得购买吗?

这得看状况。因为有多种场景:

如果你是高级程序员,假如正在学习 python,不倡议应用 Copilot 之类的工具。因为初学者可能不会正确理解代码的工作原理。而 GitHub 提供了简略的办法,这种捷径对于学习来说并不好。

如果在编程方面具备中级教训和常识的人,那么你就能够开始了。因为它能够使你更容易编码以及更快地实现我的项目。

当初咱们曾经探讨了谁应该应用它,谁不应该应用它。当初咱们的最终问题将是“它值得花钱吗?”。

如果你是学生,那么能够申请教育的免费版,所以强烈推荐你应用它(因为白嫖使人高兴)。如果你的支出很稳固并且能负担得起 10 美元 / 月,那么 Copilot 相对物有所值。它为你节俭的工夫相对要比 10 每月多的多。然而须要记住的是它反对的是以下语言(Python, JavaScript, TypeScript, Ruby, Go, C#, C++),所以如果你用 JAVA, 那还是不必思考了。

最初 Copilot 当初有 2 个月的收费试用,所以不论你买还是不买,先白嫖两个月再说

https://avoid.overfit.cn/post/938a0652aa7244269f423f20e92fe625

正文完
 0