大模型时代的版权边界在哪里

  近期,美国《纽约时报》在纽约南区法院向OpenAI及其投资人微软公司提起侵犯版权诉讼,指控二者未经许可使用其数百万篇文章以训练人工智能模型,而这些聊天机器人现在与该新闻机构形成竞争,成为可靠的信息来源。

  诉讼未明确提出具体的赔偿金额要求,但称被告应对与“非法复制和使用《纽约时报》独特有价值的作品”相关的“数十亿美元的法定和实际损害”负责,还要求被告销毁使用《纽约时报》版权材料的所有AI模型和训练数据。

  在投诉中《纽约时报》表示曾于2023年4月与微软和OpenAI进行了接触,提出了对其知识产权使用的担忧,并探讨“友好解决”的可能性,但谈判未产生解决方案。当地时间1月8日,OpenAI首次针对《纽约时报》提起的诉讼进行了正式回应,称《纽约时报》并未讲述完整的故事,其诉讼毫无根据。尽管如此,公司仍然希望与其建立建设性的合作伙伴关系,并尊重其悠久的历史。

  1月18日,OpenAI的创始人山姆·奥尔特曼(Sam Altman)在瑞士达沃斯世界经济论坛上也对外表示,双方在起诉消息曝光前曾进行了“富有成效的谈判”,对《纽约时报》的起诉感到惊讶。他指出,OpenAI希望以“大量资金”向该内容出版社支付费用,以在ChatGPT中展示他们的内容,但实际上并不需要在他们的数据上进行人工智能训练。“我认为人们不太理解这一点。任何一个特定的训练源对我们的影响并不是那么大。”

  《纽约时报》是全球首家起诉两家公司侵犯其文字作品版权的美国大型媒体机构。此次诉讼拉开了未经授权使用已发布作品训练人工智能技术的“法律战役”新篇章,或将成为影响AIGC(生成式人工智能)领域走向的重大事件。

  业内争议不断 版权诉讼频发

  这场诉讼引起了业内关于内容创作者与人工智能开发者之间权益平衡的讨论。支持者和反对者各执一词,有人认为知识产权至上,OpenAI侵犯了《纽约时报》的劳动成果,甚至可能威胁到新闻业的独立性;也有人认为,大模型可以像人一样免费学习,侵权的关键在于作品的输出内容,而非输入内容。

  美国数字广告局(Digital Content Next)首席执行官杰森·金特(Jason Kint)在社交媒体X(原推特)上指出《纽约时报》理由充分,其中包括《纽约时报》的内容是OpenAI用来训练大模型的关键来源,以及《纽约时报》提供的100多个GPT-4输出内容和《纽约时报》报道文章高度相似的例子。

  美国作家、科技评论家丹尼尔·杰弗里斯(Daniel Jeffries)则提出相反观点,认为要求每个人为训练数据支付授权费是不切实际的,这也不是美国版权法所谈论的关键,“版权法的宗旨是防止人们完全复制或近似复制内容,并为了商业利益将其发布。”

(责任编辑:AK007)