2024年初,美国作家布莱恩·纳泽米安等人向加州北区联邦法院起诉英伟达,指控其开发AI工具过程中非法使用受版权保护的书籍作为训练数据。原告称这些材料来自"影子图书馆"等盗版资源库,并提交修订版起诉书补充新证据。 案件的核心争议在于两个问题:科技公司员工讨论盗版资源是否构成侵权预备,以及如何界定训练数据来源的合法性。原告援引英伟达内部通信记录,声称员工曾讨论访问盗版书库Anna's Archive的可能性,以此证明侵权故意。 1月29日,英伟达提交的驳回动议从三个上进行抗辩。首先,公司强调"讨论不等于实施"的法律原则,指出内部交流不能直接证明侵权行为。其次,质疑原告未能提供作品被复制的具体时间、方式和模型等关键信息。最后,批评原告滥用"基于信息与信念"的模糊指控方式。 这起诉讼反映了AI产业面临的现实困境:大模型训练需要海量文本数据,但版权保护的底线不容突破。案件的审理结果可能为行业确立重要判例,影响科技公司的数据采集策略和合规标准。 目前案件由联邦法官乔恩·蒂加尔审理,驳回动议听证定于2026年4月2日举行。法律专家指出,本案可能经历漫长诉讼周期,最终裁决或将上诉至更高法院。在此期间,科技公司与内容创作者的版权博弈将继续发展。
英伟达案件表明,AI产业已进入需要更加明确法律框架来规范的阶段;无论最终判决如何,这起诉讼都在推动业界思考一个根本问题:在数据驱动的AI时代,企业应当如何在创新需求与知识产权保护之间找到平衡。这不仅是一场法律争议,更是对AI产业未来发展方向的重要探讨。