OpenAI 于 2 月 1 日正式推出最新的小型推理模型 o3-mini!这款模型专为 STEM 领域(科学、数学、编程)优化,旨在提供强大的逻辑推理能力,同时保持低成本与低延迟。与前代 o1-mini 相比,o3-mini 运算速度更快、回答更准确,且错误率降低了 39%,成为当前最具竞争力的轻量级 AI 模型之一。
o3-mini 今日起正式开放,用户可通过 ChatGPT(包括 Plus、Team、Pro 方案)及 OpenAI API 进行访问,企业版本将于 2 月 开放。值得注意的是,这是 首次向免费用户开放的推理模型,任何人都可以在 ChatGPT 中选择“Reason”模式或重新生成回应来体验。
o3-mini 的五大关键升级
1. 支持多种开发者功能,轻松投入生产环境
o3-mini 是 OpenAI 首款支持开发者热门功能的小型推理模型,主要包括:
- 函数调用(Function Calling) — 让 AI 与应用程序无缝整合
- 结构化输出(Structured Outputs) — 生成 JSON、表格等格式的数据
- 开发者消息(Developer Messages) — 增强 API 交互体验
- 流式响应(Streaming) — 支持实时流式输出,提升互动效率
这些功能使得 o3-mini 成为真正可用于生产环境的 AI 推理模型,开发者可以立即将其整合到应用程序或服务中。
2. 提供灵活的推理模式,满足不同需求
开发者可以选择 低、中、高 三种推理等级(reasoning effort):
- 低推理模式(Low) — 速度最快,适合简单任务
- 中推理模式(Medium) — 平衡速度与准确性,适合大多数应用
- 高推理模式(High) — 进行更深入计算与分析,适应高难度问题
这一设计使得 o3-mini 能够 快速回应常规问题,同时在 面对复杂挑战时“思考更深入”,提升应用场景的灵活性。
3. STEM 领域表现卓越,超越 o1-mini!
测试结果显示,o3-mini 在 STEM 领域的表现比 o1-mini 更加精确,在某些领域与 o1 平起平坐:
- 数学(AIME 2024 测试) — 高推理模式下达 83.6% 准确度,远超前代
- 博士级科学问答(GPQA Diamond 测试) — 高推理模式下达 77% 准确度
- 研究级数学(FrontierMath 测试) — 高推理模式能解决 32% 难题,其中 28% 属于高难度问题(T3)
- 竞赛级编程(Codeforces 测试) — 最高 Elo 分数达 2073,超越 o1-mini
- 软件工程(SWE-bench 测试) — 高推理模式下准确率达 48.9%
这些结果表明,o3-mini 特别适合数学、科学、编程等技术领域,能够帮助开发者解决更复杂的问题。
4. 更快的响应速度,平均快 24%!
与 o1-mini 相比,o3-mini 响应时间平均缩短 24%:
- ⏱ o3-mini 响应时间:7.7 秒
- ⏳ o1-mini 响应时间:10.16 秒
这意味着不仅可以处理更复杂的问题,还能以更快的速度提供解决方案,对于 即时应用(如聊天机器人、客服系统)而言是一大优势。
5. 三倍增速!ChatGPT Plus 与 Team 用户升级至 150 条消息/天
为了让更多用户体验 o3-mini 的强大功能,OpenAI 也对 ChatGPT Plus 和 Team 订阅方案进行了升级:
- Plus & Team 订阅者:每日消息上限从 50 增加到 150
- Pro 订阅者:可无限访问 o3-mini 及 o3-mini-high
此外,o3-mini 还支持 即时搜索,可提供带有网页来源的最新答案,这是 OpenAI 在整合搜索技术上的新尝试。
如何使用 OpenAI o3-mini?免费用户也受益
现在,开发者与用户可以通过多种方式访问 o3-mini:
✅ ChatGPT 用户(免费 & 付费)
- 免费用户 — 选择“Reason”模式 或 重新生成回应 即可体验
- Plus、Team、Pro 用户 — 可直接在 ChatGPT 内选择 o3-mini,享受更高效能与更快响应
✅ 开发者(API 访问)
- API 使用层级 3-5 的开发者可访问 Chat Completions API、Assistants API、Batch API
-
企业用户将于 2 月 获得完整访问权限
-
o3-mini(标准版) — 中等推理模式,适合大多数应用
- o3-mini-high(高推理版) — 进行更深入计算,适合高难度问题(仅限 Pro 方案)
o3-mini 引领小型 AI 模型新纪元
OpenAI 表示,o3-mini 代表着 OpenAI 在小型推理模型领域的重大突破,带来了 更高效、更准确、更灵活的 AI 方案。无论是开发者、科学家、数学家、程序设计师,甚至是一般用户,都能通过 o3-mini 享受到 高品质的 AI 推理能力。