OpenAI o1 预览版与模型体验:如何使用 o1-preview 和 o1-mini?

昨晚,OpenAI 正式发布了 o1 预览版!这一系列新的 AI 模型旨在在做出响应之前,花更多时间进行思考。

o1 的命名由来

OpenAI 表示:

对于复杂推理任务来说,这是一个重要的进展,代表了人工智能能力的新水平。鉴于此,我们将计数器重置为 1,并将这一系列命名为 OpenAI o1。

简单来说,这次模型的强大,甚至让 OpenAI 不惜推掉了过去 GPT 系列的命名,重新起了一个 o 系列。

OpenAI o1 的发布,标志着 AI 行业将快速推进 AGI。

OpenAI 最新 o1 模型表现如何?

OpenAI 最新版本的 o1 模型在数学能力、代码能力以及其他理科问题上表现出色。

  • 在 AIME 2024 高水平数学竞赛中,GPT-4o 的准确率为 13.4%,而 o1 预览版达到了 56.7%,未发布的 o1 正式版预计为 83.3%。
  • 在代码竞赛中,GPT-4o 的准确率为 11.0%,o1 预览版为 62%,o1 正式版为 89%。
  • 在博士级科学问题 (GPQA Diamond) 测试中,GPT-4o 的得分为 56.1,人类专家水平为 69.7,而 o1 达到了惊人的 78%。

特别是在测试化学、物理和生物学专业知识的基准 GPQA-diamond 上,o1 的表现全面超过了人类博士专家,成为有史以来第一个获得此成就的模型。

未来,文科类问题可以使用 Claude 回答,而理科相关问题则使用 OpenAI 最新的 o1-preview 模型。

需要注意的是,目前 OpenAI 最新的 o1 模型在功能上有所限制,但这也是早期版本的特征。

如何使用 OpenAI 的 o1 模型?

目前,o1 模型已逐步向所有 ChatGPT Plus 和 Team 用户开放,只有付费升级的用户才能使用最新的 o1 模型。

  • o1:新的大模型天花板,过于强大目前不方便对外公开。
  • o1-preview:o1 的预览版,立即提供给 ChatGPT 付费用户和 API 用户。
  • o1-mini:速度更快、性价比更高,适用于需要推理但不需广泛世界知识的任务。

o1-mini 更快更小,适合数学和代码任务,但在世界知识方面有所欠缺。

然而,OpenAI 一贯的特点是,越是最新最强大的模型,使用限制越多,价格也越贵。

o1 预览版使用限制为每周 30 条,o1-mini 为 50 条。

当前只有付费升级到 ChatGPT Plus 的用户才能使用最新版本的 o1 模型。

OpenAI 最新 o1 模型好用吗?

我使用 o1 模型,问了一个其他大语言模型几乎都无法回答的问题,看看 o1 模型能否正确回答。

农夫需要把狼、羊和白菜都带过河,但每次只能带一样物品,而且狼和羊不能单独相处,羊和白菜也不能单独相处,问农夫该如何过河。

经过 6 秒的思考,o1 给出了一个完美的回答,令人惊叹。

再来一个更难的奥数题,o1 模型在思考了整整 1 分钟后,给出了正确答案。

OpenAI 最新 o1 模型提示词

目前我发现,使用以下提示词能够有效提高 o1 模型的回答质量:

  • 保持提示简单直接:模型擅长理解和响应简短、清晰的指令。
  • 避免思路链提示:不需要提示模型“逐步思考”或“解释你的推理”。
  • 使用分隔符提高清晰度:使用三重引号、XML 标签或章节标题等分隔符来清楚地指示输入的不同部分。
  • 限制检索增强生成 (RAG) 中的附加上下文:提供最相关的信息,以防止模型过度复杂化其响应。

OpenAI 最新 o1 模型的使用限制

根据官方最新通知:

o1 预览版使用限制为每周 30 条,o1-mini 为 50 条。

当使用超过限制时,会出现如下提示:

You’ve hit the Plus plan limit for o1-preview
Response will use another model until your limit resets September 18, 2024

此时只能使用其他模型,等到 o1-preview 重新解锁后才能使用。

OpenAI 最新 o1 模型值得升级使用吗?

就我个人来看,o1 模型是目前最强大的大语言模型,但由于其思考时间和每周使用次数的限制,可能并不适合大部分人,也不适合日常使用。

然而,o1 的未来绝对不止是一个普通的 ChatGPT,而是我们迈向下个时代的重要基石。

因此,建议大家尝试,但日常使用仍以 GPT-4o 为主。

如何升级使用 OpenAI 最新 o1 模型?

目前 o1 模型已全面向所有 ChatGPT Plus 和 Team 用户开放,只有升级到 ChatGPT Plus 的用户才能使用最新的 o1 模型。

由于 OpenAI 限制了国内银行卡,使用国内银行卡绑定支付时可能会提示支付失败。

最佳的升级方式是借助海外虚拟信用卡进行付费升级,推荐使用 野卡 | 一分钟注册,轻松订阅海外线上服务

在 野卡 官网选择“立即开通”,即可进行虚拟卡的开通。

成功注册后,进入 野卡 首页,点击右侧导航栏的“ChatGPT Plus 一键升级”,按照官方教程完成升级。

如在开通和使用 ChatGPT Plus 的过程中遇到任何问题,可以咨询在线客服,响应速度很快。

(0)
上一篇 2025年7月11日
下一篇 2025年7月12日

相关推荐