概述
2023年11月1日,28个国家的代表——包括美国、中国、欧盟和英国——在英格兰白金汉郡布莱切利园举办的首届AI安全峰会结束时签署了《布莱切利宣言》。布莱切利园正是二战期间阿兰·图灵和同事们破解纳粹德国Enigma密码机的历史性场所。
这份宣言是首个专门聚焦于前沿AI风险的国际政府协议——涉及当前技术能力边沿的最先进AI系统。其意义不在于其约束性条款(实际上没有),而在于确立了AI安全是共同国际关切的事项,即使是地缘政治对手也能在此找到共同立场。
宣言内容
《布莱切利宣言》承认:
- 前沿AI模型带来**“严重甚至灾难性”**潜在危害,包括对关键基础设施的威胁、协助生物和化学武器开发、以及对人类控制的丧失
- 这些风险是跨国性的——没有单一国家能够单独应对
- AI开发者的透明度和问责制是安全的必要条件
- 在AI安全研究、标准和信息共享方面的国际合作不可或缺
值得注意的是,宣言刻意避免规定具体法规、时间表或执行机制——这是为了实现将中国与西方民主国家共同纳入这一史无前例包容性的刻意选择。
参与者
28个签署方包括:
- 美国(副总统卡马拉·哈里斯代表出席美英双边会谈)
- 中国(科技部副部长吴朝晖代表出席)
- 欧盟(专员Vera Jourová代表出席)
- 英国、法国、德国、日本、韩国、印度、澳大利亚、加拿大、巴西、尼日利亚等
中国的参与具有重要外交意义:在中美关系极度紧张之际,这代表了一个罕见的合作领域;中国随后参与2024年首尔AI峰会的行动表明其持续参与的意愿。
前沿AI框架
宣言引入了共同词汇:
- 前沿AI:当前技术边沿上能力最强的通用AI模型
- 前沿风险:专门源于前沿模型前所未有的能力的风险,有别于现行法律已涵盖的较窄AI危害(偏见、歧视、隐私)
这一区分——已有AI危害与新兴前沿风险之间的区别——在全球范围内塑造了此后的政策讨论。
后续:首尔及以后
《布莱切利宣言》确立了国际AI安全峰会的节奏:
- 首尔AI峰会(2024年5月):16个国家和主要AI公司签署"前沿AI安全承诺",承诺在部署前进行安全测试和红队演练
- 巴黎AI行动峰会(2025年2月):更广泛关注AI治理、获取和经济影响
- AI安全研究所网络:美国、英国、欧盟、日本等建立协调一致的AI安全评估机构