OpenAI回应被纽约时报起诉:使用公开素材训练合理,单一数据源不重要

  AI(人工智能)新锐巨头OpenAI再次回应被《纽约时报》起诉事宜。

  当地时间1月8日,OpenAI通过官网发布一份声明称,《纽约时报》的诉讼毫无根据,且没有讲述完整的事实。

  2023年12月27日,《纽约时报》以侵犯版权为由起诉OpenAI和微软,成为了第一家起诉这两家公司侵犯其文字作品版权的美国大型媒体。《纽约时报》指出,被告应为“非法复制和使用《纽约时报》独特且有价值的作品”和与之相关的“价值数十亿美元的法定和实际损失”负责。此外,《纽约时报》要求两家公司销毁任何使用到《纽约时报》版权材料的聊天机器人模型和训练数据。

  在最新的声明中,OpenAI认为《纽约时报》并未讲述全部的事实。OpenAI提到,通过2023年12月19日的最后一次沟通,公司与《纽约时报》的讨论似乎取得了建设性进展,但纽约时报12月27日提起诉讼,令公司感到惊讶和失望。

  此次声明并非OpenAI第一次公开回应被起诉事宜。当地时间1月4日,OpenAI的知识产权和内容首席汤姆·鲁宾(Tom Rubin)曾在一个采访中回应被《纽约时报》起诉,称感到“惊讶”,因为在《纽约时报》起诉公司之前,双方正处于“非常积极和富有成效的谈判中”。

  在最新的声明中,OpenAI还提到双方沟通的一个细节:《纽约时报》提到,看到了一些内容的反刍,公司承诺调查和解决这些问题,但一再拒绝分享任何示例。

  OpenAI强调,《纽约时报》的诉讼毫无根据,尽管如此,公司仍然希望与其建立建设性的合作伙伴关系,并尊重其悠久的历史。关于与新闻机构的合作。OpenAI还提到,公司与数十家以及新闻/媒体联盟等行业组织联系沟通,以探索机会,讨论他们的担忧并提供解决方案,公司的目标是支持健康的新闻生态系统,成为良好的合作伙伴,创造互利的机会。

  对于使用公开的互联网材料训练AI模型,OpenAI认为,这种合理使用得到了长期存在,并有广泛的先例支持。这一原则对创造者公平,对创新者必要。尽管如此,公司还为出版商提供了一个简单的选择退出流程,以防止公司的工具访问纽约时报这样的网站。

  反刍(Regurgitation)是指特定内容在大模型的训练数据中多次出现。对此,OpenAI强调,这是一种罕见的失败,公司采取了措施来限制并非故意的记忆,并防止大模型输出中的反刍现象。同时,OpenAI强调,故意操纵其大模型进行反刍,并不是对技术的适当使用,也违反了使用条款。

  “由于大模型是从人类知识的巨大集合中学习,因此任何一个部门都只是整体训练数据的一小部分,任何单一数据源,包括《纽约时报》,对于大模型的预期学习并不重要。”OpenAI表示。

(责任编辑:AK007)