在训练人工智能模型时使用个人信息应与使用受版权保护的材料同等对待

围绕人工智能模型训练中个人数据使用权的讨论热度颇高。我始终认为，根本无需为训练好的AI模型赋予删除、更正甚至访问个人信息的权利——因为训练好的AI模型本身并不真正持有任何个人信息（这或许值得另写一篇长文探讨）。法院支持MetaPlatform驳回诉讼动议的论点似乎印证了这一观点——既然AI模型本身不包含受版权保护材料的衍生作品，那么经过训练的大型语言模型（LLM）同样不应包含任何形式的个人信息（依据任何现代定义皆然）。

当然，时间会证明法院是否会直接处理为训练人工智能模型本身所使用的个人信息提供数据主体权利的问题。目前我们所知的是，美国联邦贸易委员会要求在使用个人信息训练人工智能模型时必须提供通知。

原告方声称"LLaMA语言模型本身构成侵权的衍生作品"，理由是"这些模型若没有从原告著作中提取的表达性信息便无法运作"。这种说法毫无道理。衍生作品是指"基于一项或多项现有作品创作，以任何形式对作品进行改写、转换或改编"的作品（《美国法典》第17编第101条）。LLaMA模型本身绝不可能被理解为对原告任何著作的改写或改编。
查看引用文章

[email protected]

圣地亚哥 858.847.6737

热门搜索

在训练人工智能模型时使用个人信息应与使用受版权保护的材料同等对待

作者

史蒂文·M·米伦多夫

相关洞察

新诉讼将考验捐赠者建议基金咨询特权的边界

联邦巡回上诉法院关于家禽专利的裁决对“关于”一词有何启示

是在“借来的时间”里工作吗？股权追索权票据的风险回报分析