所有事件
governance
☆ 世家

OpenAI、Anthropic与Google组建联合前沿模型防御联盟

概述 作为对 Chinese AI能力快速发展的回应——最显著的是DeepSeek R1(2025年1月)的展示以及2026年2月报道的"三周内发布七个模型"的发展冲刺——OpenAI、Anthropic和Google宣布了一个联合框架,以限制国家行为者对前沿模型的未经授权蒸馏。 联盟的举措 该联合框架围绕以下几个举措展开: 共享蒸馏检测工具:三家公司都承诺部署水印和检测系统,以识别其模型是否被用于未经授权地训练竞争模型 协调访问限制:对来自标记司法管辖区的API访问增强审查 …

2026-04-06

概述

作为对 Chinese AI能力快速发展的回应——最显著的是DeepSeek R1(2025年1月)的展示以及2026年2月报道的"三周内发布七个模型"的发展冲刺——OpenAI、Anthropic和Google宣布了一个联合框架,以限制国家行为者对前沿模型的未经授权蒸馏。

联盟的举措

该联合框架围绕以下几个举措展开:

  1. 共享蒸馏检测工具:三家公司都承诺部署水印和检测系统,以识别其模型是否被用于未经授权地训练竞争模型
  2. 协调访问限制:对来自标记司法管辖区的API访问增强审查流程
  3. 情报共享:一个联合威胁情报职能,用于监控和应对试图窃取模型的行为
  4. 政策倡导:协调游说以扩大美国芯片出口管制和AI知识产权保护

背景

该公告发布于 Anthropic的Mythos披露(4月7日)后几天,并被明确表述为对前沿AI能力落入敌对势力手中对国家安全影响的回应。财政部长和美联储主席于4月10日专门召集银行CEO讨论AI使能的网络安全威胁带来的系统性风险。

蒸馏问题

模型蒸馏——使用大模型的输出训练一个更小、具竞争力的模型——一直是一个持续关注的问题。DeepSeek R1的架构被广泛分析为借鉴了可在OpenAI的o1中观察到的技术,这引发了关于前沿模型排他性实际可执行性的问题。

参考资料