物理位 | 社会公众号 QbitAI
GitHub在今年11月遭自发性民事诉讼。
现在,有关其另一面的科学知识共享资源难题被挑出来,英国版权清扫服务中心(CCC)的董事会主席Roy Kaufman特意发表文章表示:
GitHub给的代码一般来说没代笔,违背了版权许可许可证协定CC BY 4.0。
该文一时间,GitHub再次被拉到众矢之的,引发热切探讨。
那场控告的导火线是GitHub与OpenAI协力研制的“敲标识符宝物”:Copilot。
当时,正式宣布正式发布不出5个月的Copilot已惹恼了众位开发人员,主要就难题能归纳为“侵权行为”两字词。
科学知识共享资源难题再次
英国版权清扫服务中心的Roy在该文写到,只不过CC BY 4.0的明确规定已经算十分收紧了:
只要有科学合理的代笔,就能在没附加许可证的情况下,把使用者上载的文档用作文档数据分析、机器学习,以及AI体能训练(可泛称为Text Data Mining,TDM)。
哈特,GitHub Copilot得出的标识符连这两点都做不出——因为它常常没标示译者代笔。
总而言之,GitHub主要就是个用作撷取开源标识符的网络平台,但非官方这样随便侵吞使用者上载的文档,仍然被控违背许多法律条文和协定。
有网民表示:
(根据相关法律条文),不能通过修改PS3服务供应商的使用条文,随便侵吞使用者上载的文档。
还有人把Copilot和Google书刊(Google Books)作比较,后者用作搜索Google扫描的书籍、杂志全文,并可通过光学字符识别(OCR)转换为文档。该网友表示:
二者有一个明显的不同之处:Google书刊一次只允许你访问2页文档。
事实上,Google书刊也曾被作家协会控告,但人家Google最后胜诉了。
因为法院在权衡版权侵权行为难题时,会考虑“实用性 ”以及“充分改造性”等难题。
有吃瓜网民补充调侃道,虽然Google很有可能把这些电子版书籍的文档上载到自家的云上了,但是:
即便人家没用这些东西来搞AI写短篇小说。
言外之意,就是假如Google来搞类似Copilot的事情,那他们可能也要面临大麻烦。
违背多项法律条文和协定
至于GitHub Copilot违背了哪些协定,原告表示,其中包括英国的数字千年版权法(Digital Millennium Copyright Act,DMCA)。
DMCA主要就有以下部分:
版权技术措施法案(Copyright Technical Measures Act):明确规定在数字领域中可使用的技术保护措施,防止未经许可证被侵吞。
网络服务提供商责任限制法案(Online Copyright Infringement Liability Limitation Act):明确规定网络服务提供商(如网站或云服务)在使用者侵权行为行为方面的责任。
对破解加密技术的刑事处罚条例(Criminal Penalties for Circumvention of Encryption Measures):破解加密技术,可能构成刑事犯罪。
版权投诉通知制度(Copyright Complaint Notification System):明确规定版权所有者如何投诉侵权行为行为,以及网络服务提供商应对投诉的责任和义务。
据其中的“网络服务提供商责任限制法案”,如果服务供应商希望使用使用者上载文档,需征得使用者同意,并且在使用时给予适当的代笔。(嗯,又是代笔…)
除了DMCA,Copilot还涉嫌违背了加州消费者隐私法等,以及前文提到的CC BY 4.0。
总而言之,GitHub和Copilot被控违背的法律条文和明确规定十分错综复杂。
目前,本案尚处于早期阶段,不管最终判决结果如何,都还有很长的路要走。
值得一提的是,民事诉讼发起者,干了20多年的老开发人员Matthew Butterrick已激活了自己的律师资格证,特意来细究这些难题。
参考链接:
[1]https://scholarlykitchen.sspnet.org/2023/01/05/github-is-sued-and-we-may-learn-something-about-creative-commons-licensing/
[2]https://news.ycombinator.com/item?id=34274326



