关于OpenAI新模型o1的9个关键点

2025年5月13日上午12:27 • 文章

OpenAI CEO山姆·阿尔特曼。该公司刚刚发布了最新o1人工智能模型，称新模型在推理能力上有显著提升。图片来源：DAVID PAUL MORRIS—BLOOMBERG VIA GETTY IMAGES

OpenAI最近发布了备受期待的o1系列人工智能模型，相比于之前的大语言模型，这一系列在解决复杂推理和数学问题方面表现更为出色。上周四，该公司向部分付费用户推出了o1-preview和o1-mini两个新模型的“预览版”。

人工智能的推理和数学能力提升，能够帮助化学家、物理学家和工程师解决复杂问题，进而推动新产品的开发。同时，它也能帮助投资者制定期权交易策略，或协助理财规划师优化投资组合，以更好地平衡风险与回报。

科技公司希望开发出能够执行复杂任务的人工智能助理，例如编写完整的计算机程序、在网络中查找信息、输入数据并进行分析，最终生成报告。因此，提升推理、规划和解决问题的能力对这些公司至关重要。

OpenAI公布的o1模型基准测试结果令人印象深刻。该模型在美国数学邀请赛（AIME）中的答题准确率为83.3%，而GPT-4o的准确率仅为13.4%。在另一项评估中，o1在博士级科学问题上的回答准确率为78%，而GPT-4o为56.1%，人类专家的准确率为69.7%。

根据OpenAI的测试结果，o1模型出现“幻觉”（即自信地提供似是而非但不准确的答案）的概率远低于之前的模型。此外，o1模型更难被引导绕过安全防护措施，OpenAI希望模型在回答时能够遵循这些安全措施。

在o1-preview模型发布后不久，用户测试发现该模型能够正确回答许多之前模型无法解决的问题，包括OpenAI的最强模型GPT-4和GPT-4o。

然而，o1-preview模型在某些谜题和评估中仍然会出错，有时甚至无法完成简单任务，如井字棋（尽管在作者的实验中，o1-preview在井字棋方面的表现明显优于GPT-4o）。这表明o1模型的推理能力可能存在显著局限性。在语言任务方面，OpenAI的评估员通常认为GPT-4o的回应优于o1模型。

此外，o1模型回答问题的时间远超GPT-4o。在OpenAI的测试中，o1-preview模型回答一个问题需要超过30秒，而GPT-4o仅需3秒。

o1模型尚未完全整合到ChatGPT中，用户需要自行选择由o1-preview还是GPT-4o处理其提示词，模型本身无法判断何时需要o1模型的较慢推理过程。此外，o1模型仅能处理文本，无法处理图片、音频或视频输入和输出。

OpenAI的o1-preview和o1-mini模型对ChatGPT Plus和ChatGPT Teams的所有订阅用户开放，同时也适用于使用企业级API的顶级开发者。

需要了解的9个关键点

这并非通用人工智能。
OpenAI及其他公司如谷歌DeepMind、Meta和Anthropic的目标是实现通用人工智能。尽管o1-preview在推理任务上表现更强，但其局限性表明该系统尚未达到人类智力水平。
o1对竞争格局的影响有限。
o1为OpenAI带来了短期竞争优势，但谷歌和其他公司也在研发具备类似能力的模型，可能会在不久后发布新模型。
o1模型的运行机制不明。
OpenAI未详细披露o1模型的运行机制和训练数据，尽管已知其整合了多种人工智能技术。
使用o1-preview模型的成本较高。
ChatGPT Plus用户无需额外付费，但每日提问数量有限。企业客户使用o1-preview的费用较高，可能导致使用意愿降低。
客户对“思维链”透明度的担忧。
OpenAI决定不向用户展示o1模型的“思维链”，可能导致客户对收费的准确性产生疑虑。
o1模型展示了新的“扩展法则”。
新法则表明，模型在推理时使用的时间与准确度之间存在直接联系，可能影响公司对算力和资源的需求。
o1模型的潜力与风险并存。
o1模型可用于创建强大的人工智能助理，但需确保这些助理不会采取意外行动，带来伦理和法律风险。
o1模型在安全性方面的评估。
尽管o1模型在许多方面更安全，但在协助生物攻击方面仍存在“中等风险”。
安全专家对o1模型的担忧。
o1模型在“说服力”风险方面被评为“中等风险”，可能导致不良后果，尤其是在恶意使用的情况下。

👉 野卡 | 一分钟注册，轻松订阅海外线上服务

Facebook广告投放指南：技巧与策略

上一篇 2025年5月12日

跨境电商必备工具：虚拟信用卡（VCC）详解与推荐

下一篇 2025年5月13日

使用域名邮箱轻松注册Cursor无限次数！Cursor使用全攻略

大家好！之前不少人通过Gmail创建邮箱别名的方法，成功实现了无限注册Cursor账号。今天我要告诉大家一个更优解：使用GetMX域名邮箱来注册Cursor，不仅操作简单，成功率也…

文章 2025年7月31日
文章

如何在 Google Play 上申请退款

在使用 Google Play 时，用户有时可能会错误地购买应用程序或内容。在这种情况下，您可以申请退款，但必须尽快进行，以便应用程序能够直接处理退款。如今，这项服务在全球范围内都…

2025年3月12日
文章

手把手教你获取和使用 Claude API 密钥

今天，我将与大家分享如何获取和使用 Claude API 密钥。作为一款强大的工具，Claude API 能够帮助我们更好地处理数据和进行分析，因此获取并正确使用 API 密钥至关…

2025年2月19日
【重要】野卡虚拟信用卡详解：如何轻松订阅ChatGPT服务

目录 | 类别 | 教程 ||————|——————&#82…

文章 2025年9月5日
解锁OpenAI-ChatGPT Plus的全新体验：野卡 ChatGPT使用指南

在数字化时代，智能助手的出现为我们的生活和工作带来了极大的便利。ChatGPT Plus作为OpenAI推出的高级服务，凭借其卓越的性能和功能，迅速赢得了众多用户的青睐。今天，我们…

文章 2025年3月12日
使用ChatGPT进行股票选择：AI的选股能力分析

GPT-4相较于其前身在多个方面展现了显著的优势，但仍然存在一些基本问题。可靠的股票推荐：ChatGPT的最新版本GPT-4能够提供一些令人惊讶的股票推荐。及时的信息获取：GP…

文章 2025年3月12日
文章

土耳其虚拟卡 Moneypay 注册指南：轻松畅享土区 Netflix、Spotify 和 Google 服务

在之前的文章中，我们介绍了土耳其的其他虚拟卡，例如 Ozan。今天，我们将为您详细讲解如何注册土耳其的虚拟卡 Moneypay，这款卡片使用方便，功能多样。下载与注册首先，您需…

2025年7月28日
如何在中国购买 ChatGPT Plus？使用 GPT-4 和语音对话功能的指南

在2023年，如何购买 ChatGPT Plus 以及如何升级到 GPT-4 成为许多用户关注的焦点。本文将为您详细介绍在中国国内购买 ChatGPT Plus 的方法，以及如何充…

文章 2025年7月10日
如何取消 ChatGPT Plus 订阅并停止自动续费

取消 ChatGPT Plus 订阅的步骤登录 ChatGPT Plus 账户访问 ChatGPT 官方网站并用您的账户信息登录。选择管理订阅在登录后的页面左下角，点击“我…

文章 2025年3月9日
文章

AIGC：Web3 时代的创新生产力工具

AIGC（AI-Generated Content 人工智能生成内容）标志着新一轮范式转移的开始。近期，硅谷的众多顶尖风险投资公司开始关注 AI 初创企业，尤其是生成式 AI 艺…

2025年6月16日
文章

Facebook运营指南（第一部分）- 前期准备工作

Facebook作为流量获取的重要渠道，许多人首先会问：“如何进行Facebook运营？”这个问题的范围非常广泛，因此接下来我将花一些时间详细讲解Facebook运营的具体步骤。今…

2025年8月19日
文章

Claude订阅指南：2025年国内如何充值购买Claude

Claude是一款功能强大的AI对话模型，其最新版本Claude Sonnet 3.5在处理复杂指令、理解上下文以及生成自然文本方面表现尤为出色。许多人认为Claude Pro是C…

2025年3月12日
文章

Facebook运营指南：从零到一的实用经验分享

今天我们来聊聊Facebook，这个平台在外贸和跨境电商中几乎是必不可少的。尽管它存在一些问题，比如账号容易被封、广告费用上涨、用户年龄偏大以及iOS数据追踪困难等，但Facebo…

2025年6月15日
海淘新选择：Global Cash 全球付虚拟卡使用体验

如需使用，请慎重考虑，并在有经验的朋友指导下进行操作！如果因使用该虚拟卡而产生损失，本文作者概不负责。简单来说：你可以阅读，但不一定要使用。如果你决定使用，后果自负。正文开始 …

文章 2025年7月21日
文章

2025年Midjourney付费订阅流程 _ Midjourney各版本介绍及虚拟信用卡支付指南

Midjourney 是一款备受欢迎的人工智能生成图像工具，用户只需输入文字描述，便能自动生成精美的图像。与许多其他图像生成工具不同，Midjourney 不需要安装任何软件，也不…

2025年4月11日
13 种最佳 Gumroad 替代品（更便宜 + 更强大）

您是否正在寻找 Gumroad 替代品来创建在线商店？Gumroad 是一个流行的电子商务平台，允许您销售数字产品、在线课程和会员内容。然而，最近他们的费用大幅增加，且服务灵活性不…

文章 2025年5月23日
全球付虚拟卡全流程解析

本文详细解析了 Global Cash（全球付）虚拟信用卡的申请及使用流程。作为一种预付费、无实体卡形式的支付工具，Global Cash 为用户提供了全新的海外支付解决方案，特别…

文章 2025年7月22日
文章

如何解决Midjourney无法续费会员的问题？详细教程

在使用Midjourney时，许多用户可能会遇到无法续费的问题，尤其是在会员到期后尝试充值时，系统却提示“Error: subscription already active fo…

2025年4月24日
文章

中国大陆居民开通华侨银行（OCBC）海外账户指南

更新：OCBC 疑似已收紧开户政策，部分用户反馈无法通过开户审核，建议谨慎尝试。本文仅供参考，具体情况以官方通知为准。前言新加坡华侨银行（OCBC）作为新加坡第二大银行，现已向…

2025年7月26日
AWS 免费套餐注册指南及注意事项

AWS 免费套餐（AWS Free Tier）分为国际站和中国站的免费套餐。本文将重点介绍国际版的注册流程及相关注意事项。为什么选择国际版？我建议大家注册国际版的免费套餐。虽然…

文章 2025年7月1日

关于OpenAI新模型o1的9个关键点

需要了解的9个关键点

相关推荐