在日常生活和学习中,我一直使用每月 20 美元的 ChatGPT Plus 订阅,确实帮助我解决了许多问题。ChatGPT 的出现,让我能够随时向这位几乎无所不知的“专家”提问,尽管有时他的回答并不完全准确,但总能给我带来启发。
最近,OpenAI 发布了最新的 ChatGPT 模型:O1 Pro,订阅费用比之前的 Plus 版本翻了十倍,达到了 200 美元/月。
OpenAI 官网和 Altman 在社交媒体上表示,ChatGPT O1 Pro 能够利用更多算力,为最复杂的问题提供最佳答案。
什么是“最难的问题”?
每个人对“最难的问题”都有不同的定义。目前,许多用户已经体验了 O1 Pro 的强大功能,并分享了他们的评测报告。
评测报告概述
一位用户在 24 小时内测试了 25 项任务,涵盖商业、推理、逻辑、数学、编程、科学和写作等领域。评测的目的是评估 O1 Pro 在回答这些问题时的质量、准确性和可用性。
评测结果如下:
- 推理与写作:O1 Pro 在推理、写作、逻辑、数学和科学任务中的表现令人满意,展现了强大的分析推理和问题解决能力。
- 商业计划:在制定业务计划的测试中,O1 Pro 的回答也相当令人满意,显示出对企业战略和业务概念的准确理解。然而,在财务建模等专业领域,表现不尽如人意。
- 编程能力:对于简单的编程任务,O1 Pro 表现出色,但在处理复杂编码需求时仍显不足。
评测者的结论
- O1 Pro 在依赖事实知识、逻辑推理和结构化解释的领域表现出色,能够生成高质量的书面内容和解决科学问题。
- 对于精度要求高的任务,如财务建模和复杂编码,用户需要具备更多的专业知识和技能,以便更有效地完成任务。
有网友建议,考虑到 O1 Pro 高达 200 美元/月的订阅费用,OpenAI 应为所有 Plus 用户提供一周的试用期,以便他们在满意后再决定是否升级。
Altman 对此表示赞同,并称可能会在明年进行相关尝试。
在一次微积分问题的评测中,O1 Pro 花费了 4分54秒 得出正确答案:3。而我用 Plus 账号的 O1 模式回答同样的问题只需 59 秒,似乎 O1 Pro 存在过度推理的问题。
或许我还是等明年可能发布的 O1 Pro 体验版吧?