新京报贝壳财经讯(记者罗亦丹)2026北京人工智能创新高地建设推进会于1月5日举办,会上发布北京人工智能8大前沿成果。其中,由北京前瞻人工智能安全与治理研究院发布的“前瞻人工智能安全评估体系与基座平台”在列。

作为人工智能安全与治理的代表性北京创新成果,“前瞻人工智能安全评估体系与基座平台”探讨如何以安全为基石,引领人工智能的稳健发展。该体系打破传统安全评估的单一维度局限,形成了全领域、多层次的评估框架。从覆盖范围来看,它根植基础安全,延伸至具身智能安全、科学智能安全、社会安全、环境安全、灾难性与生存性风险五大维度,覆盖教育科研、医疗健康、金融经济、信息传媒、工业基建、政务民生等多个关键领域。从评估重点来看,特别聚焦隐私与数据保护、滥用恶用、身心伤害、虚假信息防范、自主人工智能高阶风险等核心痛点,进行体系化设计与评估。

前瞻院通过测试发现了一个关键问题:近年来的大模型在安全性方面并未明显提升,部分新近模型的攻击成功率甚至更高。但同时前瞻院也验证了一个重要结论:人工智能模型防御并不必然需要重新训练模型,在在线推理阶段通过部署安全护栏,就能显著提升模型安全水平。针对前瞻安全基准中的各类风险,前瞻院打造了 “前瞻・灵御”AI安全攻防平台,可为企业提供标准化评估流程、全面系统的安全分析,帮助企业准确识别模型安全水平,并提供针对性的防御方案与加固建议。

此外,前瞻院还构建了 “前瞻・灵度”AI 伦理评估平台,专注于AI伦理的智能评估与价值校准。平台能够对上百个大模型进行实时动态监控与并行测试,评估其在六大维度、90 个细分类别的伦理合乎度。其集成了以中国价值观为核心的大规模中文价值语料库,覆盖3个层面、12个核心价值、50个衍生价值,累计25万余条规则;收录了全球 200 余项伦理原则与规范,以及40余项中英文法律法规与国际公约,提供精准的合规指引。可以对人工智能、数据安全、神经科学、脑机接口、医疗健康、生物安全、危险化学物质、核物质、自动驾驶等领域进行自动化伦理评估辅助。

前瞻院认为,人工智能安全应成为 “第一性原理”,是不可删除、无法违背的底线要求。安全治理能力基座的构建是北京引领人工智能稳健发展的基础,让我们更有把握地将AI安全地应用于现代化建设,与全世界共享人工智能发展的机遇与成果。

编辑 杨娟娟

校对 陈荻雁