OpenAI赢得一起版权诉讼,但未涉及合理使用争议
在一起新闻机构提起的版权保护案件中,OpenAI的反驳意见得到法院认可。
当地时间11月7日,美国纽约南区地方法院裁决称,作为原告的Raw Story和AlterNet两家新闻机构,虽然指控OpenAI删除训练数据集内原告方作品的版权管理信息(CMI),违反了美国《数字千年版权法》,但原告方未能证明该删除行为产生了实际的损害。
所谓“版权管理信息”,是指作品的标题、作者姓名、作品使用条款等内容。
今年2月底,Raw Story和AlterNet紧随《纽约时报》起诉OpenAI的步伐,指控这家大模型公司的三个训练集中包含了原告方的数千份新闻作品,但是删除了涉案新闻作品的作者、标题等版权管理信息。原告援引的《数字千年版权法》规定,未经版权人或法律授权,任何人不得故意删除或更改任何版权管理信息。原告方据此寻求损害赔偿和禁令救济——移除训练数据集中的涉案新闻作品副本。
OpenAI则发起驳回动议,认为原告缺乏美国宪法所规定的诉讼资格。
按照美国最高法院的判例,原告如果要在联邦法院起诉,必须证明其确实遭受了具体化的、实际或即将发生的损害,即损害必须是真实而非抽象的。美国纽约南区地方法院指出,原告并没有证明删除版权管理信息而产生的实际不利影响,缺乏寻求赔偿救济的权利。
对于禁令救济,法院认为,当用户向ChatGPT输入一个问题时,ChatGPT会将其数据库中的相关信息综合生成一个答案。鉴于数据库中包含的信息量,ChatGPT输出剽窃自原告文章内容的可能性微乎其微。虽然原告提供了第三方统计数据,表明ChatGPT早期版本生成的回应包含了大量剽窃内容,但原告并没有合理地论证ChatGPT当前版本仍存在重大风险,会生成剽窃原告文章的回复。因此,原告也缺乏寻求禁令救济的诉讼资格。
法院此处提及的大模型是综合生成答案而非直接复制剽窃的说法,响应了OpenAI此前的主张。在2023年10月提交给美国版权局的一份意见书中,OpenAI称其在预训练阶段采取了措施,避免在答案生成过程中重复训练数据的内容,因此内容输出过程中对受版权保护作品的复制极为罕见。
Raw Story和AlterNet提起的这起诉讼,和其他针对大模型公司的版权侵权案件有明显不同:原告方仅控告删除版权管理信息的行为,并未涉及使用版权作品训练大模型是否侵权的争议问题。
但审理法院也指出,原告想针对的真正问题,并非被告在数据集中删除原告作品的版权管理信息,而是被告使用原告的文章来训练ChatGPT,却没有向原告支付补偿。
为应对接踵而至的版权诉讼,OpenAI已宣布和新闻集团、康泰纳仕、美联社、英国《金融时报》等众多新闻机构开展内容使用层面的合作。
采写:南都记者 杨柳
扫描二维码推送至手机访问。
版权声明:本文由0538资讯网整理发布,内容均来自互联网,如有侵权联系8641340@qq.com删除。