所有事件
model-release
☆ 本纪

OpenAI o1 发布

概述 OpenAI o1(原代号 Strawberry)是一系列专为复杂推理任务设计的模型,通过大规模强化学习和思维链(Chain-of-Thought)技术实现了重大突破。 核心能力 数学奥赛金牌级:在美国数学邀请赛(AIME)中位列前 500 名 博士级科学推理:在 GPQA Diamond 生物学博士级别测试中超越人类专家 思维链推理:内部展开多步推理过程,而非直接输出答案 编程竞赛:Codeforces 编程评分达到 89 百分位 影响 o1 代表了 LLM 推理能力 …

2024-09-12

概述

OpenAI o1(原代号 Strawberry)是一系列专为复杂推理任务设计的模型,通过大规模强化学习和思维链(Chain-of-Thought)技术实现了重大突破。

核心能力

  • 数学奥赛金牌级:在美国数学邀请赛(AIME)中位列前 500 名
  • 博士级科学推理:在 GPQA Diamond 生物学博士级别测试中超越人类专家
  • 思维链推理:内部展开多步推理过程,而非直接输出答案
  • 编程竞赛:Codeforces 编程评分达到 89 百分位

影响

o1 代表了 LLM 推理能力的范式转变——从"记忆+模式匹配"到"真正的逻辑推理"。

参考