概述
2025年1月31日,OpenAI发布了 o3-mini ——一款为广泛API消费而定价的轻量级推理模型,同时在STEM基准上保持强劲表现。
与o3和DeepSeek R1等竞争对手的主要区别:o3-mini具有完整的网络浏览访问权限,使其成为同类中第一个能够将答案建立在当前信息基础上的推理模型。
定价
- 输入:约$0.55/百万token
- 输出:约$4.40/百万token
这比o1-mini便宜约 60%,比完整o3(根据推理深度,每个复杂查询可能花费$10-100+)便宜得多。
性能
o3-mini在大多数STEM基准上与o1表现相当:
- AIME 2024:≈85%(对比o1 ≈83%)
- GPQA Diamond:与o1持平
- Codeforces:表现稳健,但未达到Claude 3.7的水平
与DeepSeek R1相比的主要优势:网络浏览 + 函数调用 + OpenAI的API基础设施。
意义
o3-mini标志着推理模型成为 开发者工具商品化 的时刻,而不仅仅是研究展示。强大的推理能力 + 网络访问 + 低价格的组合使其成为2025年通过AI编程助手和智能体应用的默认选择。