记者/孙敬 Archer Sun
就在 OpenAI 开启「2023 生成式 AI 元年」,带动一众科技巨头如 Google、微软相继参与 AI 应用开发,期望 AI 能结合自己的服务创造更大的产业影响力。就在全球热衷 AI 带来的便利性时,近期 OpenAI 和微软遭《纽约时报》指控在没有经过授权的情况下,擅自使用《纽约时报》的内容来训练 AI 模型。
生成式 AI 之所以强大,来自它背後庞大的资料库训练,那身在台湾的我们,如果我们的作品也在未被告知的情况下,被生成式 AI 业者拿去当作训练的资料,能怎麽办?
更多新闻:从OpenAI 事件到倡议监管 回顾2023 AI重大事件
OpenAI、微软遭炎上!媒体、创作者内容被擅自拿来训练 AI 模型
美国知名新闻业者《纽约时报》去年 12 月底公开表示,已对 OpenAI、微软提告,因为这两间科技公司在没有付费、取得授权的情况下,大量使用《纽约时报》的报导内容训练 AI。《纽约时报》对比了从 OpenAI 和自家媒体产出的内容,称两者有高度的重叠,认为此举压缩《纽约时报》的付费订阅服务,而且生成式 AI 参照了《纽约时报》资料给出的建议还出现错误,影响了《纽约时报》品牌商誉。虽然没有公开具体索赔金额,但《纽约时报》已向 OpenAI、微软提出总计「数十亿美元价值」的法定、实际认列损失,并要求删除含《纽约时报》在内的 AI 机器模型资料。
OpenAI 发言人赫尔德(Lindsey Held)曾透过电子邮件回应《纽约时报》的控告,「我们尊重创作者和内容拥有者的权益,积极的与他们合作,以确保在人工智慧的新模式下获得收益」「我们与《纽约时报》的对谈正往着有建设性的方向前进,对於事件这样的发展我们感到惊讶和失望」,微软则没有对《纽约时报》的发言做出回应。
早在去年 4 月《纽约时报》便开始跟 OpenAI 商讨资源的交换方式,达成资料引用的合作,但最後并没有达成协议,现今包含路透社、BBC、CNN 在内等媒体,已经设立了爬虫防止 OpenAI 抓取网站的新闻内容。
资料被拿去训练 AI 怎麽解?台湾资讯智慧财产权协会理事长陈家骏给出答案
创作者的内容和作品被当作训练 AI 模型的资料,这究竟告不告的成?从这一两年国外创作者向 OpenAI 跟微软提告作品被拿来训练 AI 案例,只能说有很高的机会「不会赢」。以美国着作权局(United States Copyright Office)对 AI 内容生成与再制的解释为例,其认为在「创新性」基准上要有增加「新的东西」来改变原有的型态,且没有改变原着作的用途,意思有点类似动画、动漫圈常提到的「二创」概念。OpenAI 跟微软面对生成式 AI 创作的作品,指出使用的是受版权保护的作品,来当作 AI 的资料是在「合理范围」,也满足了创新性的条件,因此认定引用内容或作品再制是符合使用原则。
那台湾法规对训练生成式 AI 使用的资料规范,究竟态度为何?根据「经济部智慧财产局」《智慧财产权月刊 298 期》作者;台湾资讯智慧财产权协会理事长陈家骏观点,生成式 AI 工具服务商或使用者是否构成侵权的困难点,在於双方都有参与到「AI 内容产制」的过程,服务商没有主体上认知的侵权行为,仅能作间接侵权的角色。
使用者仅输入指令生成创作,并非侵害重制或衍生着作构成要件的主体,很难在主观上认定服务商、使用者之间,有意侵害原创作者的着作权,但毕竟双方都有参与其中,服务商提供的服务有控制、引导使用者的能力,并在生成创作、作品中获得实质的经济收益,可能会构成智财法当中的「分工侵权」,不过最终是否成立侵权还有待法院进一步厘清。