中关村推出人工智能安全评估体系与攻防平台加快构建多维治理“防火墙”

随着人工智能技术的快速迭代升级，其潜在风险也在不断扩大。

在这一背景下，中关村科技创新中心近日推出了一套系统性的人工智能安全防护方案，标志着我国在人工智能治理领域迈出了重要一步。

当前人工智能发展面临的核心问题在于安全风险的多样性和复杂性。

传统的安全评估体系往往局限于数据隐私和模型鲁棒性等单一维度，难以应对人工智能技术在实际应用中产生的多层次风险。

据研究人员介绍，现有大模型在安全性方面并未实现显著提升，部分新型模型甚至呈现出更高的攻击易感性，这反映出安全评估与防护机制的紧迫性。

为此，前瞻人工智能安全与治理研究院构建了覆盖五大维度的安全评估框架。

这一框架不仅包括传统的基础安全防护，还延伸至具身智能安全、科学智能安全、社会安全、环境安全以及灾难性与生存性风险等新兴领域。

这种多维度的设计充分考虑了人工智能技术在教育科研、医疗健康、金融经济、信息传媒、工业基建、政务民生等关键领域的广泛应用场景。

在具体防护措施上，研究院推出了两个关键平台。

其一是"前瞻·灵御"人工智能安全攻防平台，该平台通过模拟真实的攻防场景，对人工智能模型进行全面的安全性能测试。

目前平台已支持60余种主流大模型、20余种攻击方法和10余种防御机制，为模型安全提供了量化评估手段。

更为重要的是，该平台发现并验证了一个关键认知：人工智能模型的安全加固并不一定需要重新训练，在推理阶段部署安全护栏就能显著提升安全水平。

这一发现具有重要的实践意义，意味着现有模型可以通过相对低成本的方式实现安全性能的快速提升。

其二是"前�констатues灵度"伦理评估平台，该平台着重于人工智能的伦理治理与价值对齐。

平台能够在6个维度、90个细分类别中对百余个大模型进行实时动态监测，并集成了以中国价值观为核心的大规模中文价值语料库，累计定义了25万余条伦理规则。

这一设计有效解决了现有伦理评估中存在的文化适应性不足、评估边界覆盖不全等问题，确保人工智能技术的发展符合社会主流价值导向。

从隐私保护、滥用防范到虚假信息识别，这套体系系统回答了人工智能安全领域的关键问题：评什么、怎么评、怎样攻、如何防。

更重要的是，它为人工智能产业明确了安全发展的价值方向，建立了从评估、防护到伦理的全链条治理框架。

这一举措的推出正当其时。

当前全球人工智能竞争日趋激烈，安全与发展的平衡成为各国重点关注的课题。

我国在建立完善的人工智能安全评估体系方面取得先发优势，不仅有利于保护本土企业和用户权益，也为全球人工智能治理提供了中国方案和中国经验。

人工智能安全治理既是一场技术攻坚，更是一次文明命题的答卷。

中关村此次探索不仅为行业树立了“发展须与伦理同行”的标杆，更以中国智慧为全球技术治理提供了新范式。

当技术创新与安全保障形成双轮驱动，人工智能才能真正成为造福人类的基石性力量。

中关村推出人工智能安全评估体系与攻防平台 加快构建多维治理“防火墙”