问题——“像极了”背后是谁在说话 近年来,语音合成与声音建模能力快速提升,普通用户在短时间内即可生成与特定个人高度相似的声音,用于配音、客服、短视频、广告等场景。与传统模仿不同,技术手段可在不经本人到场、不需本人参与的情况下“复现”其声线特征,并可批量生成新的语句内容。乔榛的公开表态,折射出社会对“声音复刻”边界的集中关注:当声音成为可被复制与交易的“资源”,如何确认授权、厘清责任、保护人格与创作价值,成为绕不开的现实命题。 原因——技术扩散叠加商业冲动,规则供给相对滞后 一是技术门槛降低。过去需要专业设备与大量样本的声学建模,如今通过更少的音频材料即可获得较高相似度,传播速度快、复制成本低。二是商业需求驱动。一些机构为了压缩制作周期、降低人力成本,倾向于用合成声音替代真人录制;个别账号为吸引流量,刻意使用名人声线制造“真实感”。三是权属认定复杂。声音既涉及人格利益,也可能涉及表演、录音制品、配音等多重权利形态,实践中存在授权链条不清、合同条款不完善、使用场景外溢等问题。四是违法成本偏低与取证困难并存。侵权内容往往分散在多个平台、跨地域传播,权利人维权面临证据固定、责任主体识别和损失认定等现实难题。 影响——不仅是“像不像”,更关乎信任秩序与文化价值 对个人而言,未经许可的声音复刻可能造成名誉受损、身份被冒用甚至被用于虚假广告、诈骗话术,直接侵害人格权益与财产安全。对行业而言,若合成声音在商业配音中被无序使用,可能挤压专业从业者空间,扰乱市场价格体系,形成“劣币驱逐良币”的不良竞争。对社会而言,声音是信任的重要载体,一旦出现大量真假难辨的语音内容,公众对电话沟通、媒体播报乃至公共信息发布的信任基础都可能被削弱。对文化传播而言,乔榛提出的“灵魂与温度”并非抽象概念:播音、配音等艺术门类依赖对情绪、语境与节奏的把握,真实人生经验与现场表达带来的感染力难以被机械复制;若过度追求“效率替代”,可能让内容生产走向同质化与“去情感化”。 对策——以授权为前提、以标识为底线、以责任为约束 受访业内人士与法律界人士建议,应从“事前规则、事中治理、事后追责”三个层面综合施策。 在事前端,建立更清晰的授权机制与合同标准。对名人声线、职业配音等使用,应坚持明确同意原则,约定使用期限、使用范围、可转授权限制、收益分配与退出机制,避免“无限期、全场景”的一次性授权。对涉及公共人物、公共传播的语音内容,还应强化审慎义务。 在事中端,完善平台治理与内容标识。推动对合成语音进行显著标注,探索技术水印、溯源标记等手段,提高可识别性;平台应对疑似冒用他人声线的内容建立便捷投诉通道与快速处置机制,对反复违规账号实施分级惩戒。 在事后端,强化法律责任与行业自律并行。对恶意冒用、用于诈骗或造成严重后果的,应依法追究对应的责任;行业协会可制定伦理规范与负面清单,明确不得在未经授权情况下使用特定个体声线进行商业推广、虚假背书或误导性传播。 前景——让技术服务创作,让创新回到“以人为本” 多位受访者认为,声音合成技术本身具有正当应用空间,如辅助无障碍沟通、保护隐私、提升制作效率、帮助部分人群恢复表达能力等。关键在于把握边界:以尊重个体为前提,以真实告知为原则,以可追溯可问责为保障。随着相关法规制度、行业标准与平台治理工具健全,声音复刻有望在合规框架内释放积极价值,同时遏制“复制人格”“冒名代言”等乱象。
乔榛的呼吁不仅关乎个人权益,更提醒我们思考技术进步与社会价值的平衡;在人工智能时代,我们既要享受技术便利,也要守护情感、尊严和文化多样性。声音的温度和艺术的灵魂是人类文明的独特之处。如何在技术与人文之间找到平衡,让创新真正造福社会而非损害权益,是我们共同面临的课题。