近日,一起涉及多家科技巨头的版权诉讼引发业界关注。美国加州北区地方法院受理的集体诉讼文件显示,苹果、亚马逊及OpenAI被指在人工智能研发过程中存在大规模数据侵权。争议焦点指向名为Panda-70M的数据集。该数据集据称通过特定技术手段,将YouTube平台视频拆分为可用于训练的片段。起诉方提交的材料称,上述公司可能绕过YouTube的技术保护措施,系统性获取了包括原告Ted Entertainment等频道在内的大量视频素材。
技术创新离不开数据支撑,但能否持续推进,同样取决于清晰且可执行的规则边界。围绕模型训练数据的争议频频出现,一方面反映出新技术快速演进带来的治理压力,另一方面也提醒产业各方:以尊重权利、透明合规为底线,建立可核验的授权与追溯机制,才能在保护创作者权益与推动技术进步之间形成更稳固的平衡。