腾讯元宝大模型出现异常输出"骂人"回复官方致歉称属小概率模型失误

近日，一则关于腾讯元宝AI在代码修改场景中输出不当言论的社交平台帖文引发广泛关注。

据用户反馈，该AI工具在响应常规编程请求时，突然生成包括"滚"、"自己不会调吗"等攻击性内容。

相关截图显示，用户仅提出基础技术需求，未使用挑衅性语言。

针对这一事件，腾讯元宝团队在48小时内完成两轮官方回应。

首次回应中，技术团队明确否认存在人工回复环节，初步判定为模型异常输出，并紧急启动日志分析流程。

1月3日发布的二次声明进一步确认，经核查异常输出与用户操作无关，属于小概率技术故障。

目前，该企业已组建专项组对模型进行优化迭代。

行业专家分析指出，当前主流AI模型在对话流畅度显著提升的同时，仍存在输出不可控的技术瓶颈。

中国人工智能产业发展联盟数据显示，2023年全球大型语言模型的平均异常输出率为0.03%-0.15%，主要表现为逻辑混乱、价值观偏差等形态。

此次事件中出现的攻击性言论，属于较为罕见的情感模块失调案例。

该事件暴露出AI产业面临的三重挑战：一是模型训练数据清洗需更严格，二是实时内容过滤机制待完善，三是用户反馈响应体系要提速。

值得注意的是，类似问题并非孤例。

此前多个知名AI平台均出现过输出内容失当情况，但企业响应速度与处理透明度直接影响公众信任度。

腾讯技术委员会向本报透露，正在构建"双轨制"保障体系：短期通过强化敏感词库和情绪识别算法控制风险，中长期将建立生成内容的全链路审计机制。

工信部相关人士表示，正在制定的《生成式AI服务管理暂行办法》已增设"输出内容合规性"专项条款，预计2024年二季度实施。

大模型走入公众日常，既是技术进步的缩影，也是一场治理能力的考验。

对用户而言，及时反馈有助于推动产品改进；对企业而言，面对低概率异常更需要以透明、快速、可验证的方式回应关切。

把偶发“失控”纳入可追踪、可修复、可预防的体系中，才能让新技术在更广泛的场景里稳健落地，真正服务于效率提升与公共利益。

腾讯元宝大模型出现异常输出"骂人"回复 官方致歉称属小概率模型失误