关于apache:ASF-生成式工具指南

48次阅读

共计 2047 个字符,预计需要花费 6 分钟才能阅读完成。

申明 :本文是 Apache 基金会所著文章《ASF GENERATIVE TOOLING GUIDANCE》的中文译文。

原文链接 :https://www.apache.org/legal/generative-tooling.html


版本 1.0 章节(目录)

  • 对 ASF 我的项目的奉献是否包含人工智能生成的内容?
  • 文档如何解决?
  • 图像如何解决?
  • 如果奉献中蕴含人工智能生成的内容,而该内容被辨认出剽窃或复制的资料,咱们该怎么办?

对 ASF 我的项目的奉献是否包含人工智能生成的内容

Apache-2.0 许可协定和 Apache 集体奉献许可协定(ICLA)都揭示贡献者,他们有责任披露所提交奉献中任何非其自己原创且受版权保护的资料。在应用生成式人工智能工具时,以及在应用来自公共网站的材料或其余开源我的项目的代码时,这一点同样实用。

在披露这些资料时,投稿人还应阐明这些资料的许可协定状况。ASF 制订了《第三方许可政策》,就可承受的许可协定提供领导意见,并阐明如何解决第三方作品。

尽管一般来说,非人类(如机器或猴子 ) 生成的内容不具备版权,但如果内容由人工智能生成的局部和人类撰写的其余局部组成,则人类撰写的局部可能具备版权。

正如以下美国版权局注册指南 (3/16/2023)所解释的那样:

“ 例如,人类能够抉择或安顿人工智能生成的资料,使其具备足够的创造性,” 由此产生的作品整体上形成原创作品 ”。或者,艺术家能够对人工智能技术最后生成的资料进行批改,使批改达到版权保护的规范。在这些状况下,版权将只爱护作品中人类创作的局部,这些局部 ’ 独立于 ’ 人工智能生成的资料自身,并且 ’ 不影响 ’ 其版权位置 ”。

这些由人类撰写的局部可能仅仅来自人类提供的提醒或随后做出的批改。不过,生成式人工智能的一个突出问题是有可能复制其所训练的资料的局部内容,其中一些可能是受版权保护的主题。因而,在应用生成式人工智能工具时,倡议应用具备以下性能的工具:辨认任何与工具训练数据类似的内容,以及该内容的许可证。

鉴于以上所述,如果贡献者能确保全副或局部应用人工智能生成的代码能够被用于奉献:

1、生成式人工智能工具的条款和条件没有对输入后果的应用施加任何与开源定义(OSI – Open Source Definition)不统一的限度(例如,ChatGPT 的条款就不统一)。

2、至多满足以下条件之一:

    ① 输入不受版权保护的主题(即便由人制作也不属于可受版权保护的主题);

    ② 输入后果中不包含第三方资料;

    ③ 输入后果中蕴含的任何第三方资料都是在第三方版权持有者的许可下(例如,在兼容的开源许可协定下)应用的,并恪守了实用的许可条款。

3、如果人工智能工具自身提供了对于可能已被复制的资料的足够信息,或从代码扫描后果中取得了足够的信息,那么贡献者就能够正当地确定条件 2.2 或 2.3 曾经满足。

  • 例如,AWS CodeWhisperer 最近减少了一项性能,提供告诉和归属。

在提供应用生成式人工智能工具撰写的奉献时,举荐的做法是贡献者注明创立奉献时应用的工具。这应作为一个标记蕴含在源代码管制提交信息中,例如蕴含 “Generated-by: ” 短语。这样就能够思考在将来公布工具时,将这些内容提取到一个机器可解析的工具证明文件中。

最初,请留神,只管上述内容在 2023 年 6 月看来是一套正当的指导方针,但这是一个疾速倒退的畛域。无论咱们明天向项目管理委员会(PMC)倡议什么,相干政策都须要适时从新评估和更新,以适应以下状况:

  • 法律的变动
  • 人工智能技术和相干工具的变动(例如,随着人工智能模型的倒退,(1) 可能在复制其训练所根据的局部材料时发出通知,或 (2) 可能依据批示复制通过许可(或以其余形式兼容 Apache 许可协定 2.0)的受权源资料
  • 开源软件使用者对危险和模糊性容忍度的变动

咱们将持续与项目管理委员会(PMC)和 ASF 成员沟通,探讨以及更新常见问题(FAQ)的内容。

文档如何解决?

上述内容同样实用于文档。不过,最风行的文档工具 ChatGPT 有限制性许可,因而应审慎应用。

图像如何解决?

与文档一样,上述准则依然实用。只管图像是一种非文本模式,但其细节很快就会变得复杂。咱们预计这将持续是一个疾速倒退的畛域。

如果奉献中蕴含人工智能生成的内容,而该内容被辨认出剽窃或复制的资料,咱们该怎么办?

与其余任何奉献一样,请参考第三方许可政策。


开源雨林围绕开源通识、开源应用、开源奉献三大方面构建常识体系,愿把长期积攒的教训系统化分享给企业,在团队、机制、我的项目三方面提供单干,推动各企业更高效地应用开源、奉献开源,晋升全行业开源技术与利用程度。

开源雨林的内容已开源,并托管在 https://github.com/opensource-rainforest/osr,欢送通过 Pull Request 的模式奉献内容,通过 Issue 的模式展开讨论,独特保护开源雨林的内容。

如果您有新的想法,欢送退出开源雨林交换群,一起探讨。小助手微信:osrainforest(增加时请备注“交换群”)

正文完
 0