1. 发布信息
OpenAI 于 9 月 13 日发布了 o1 的预览版。
2. o1 的定位
o1 全称为 OpenAI o1,未延续之前的 GPT 系列,显示出其强大的能力。有观点认为,o1 是一个垂直基础模型,为未来的 GPT-5 提供支持。
3. 推理能力
o1 在推理方面表现出色,尤其擅长数学题和编程。在国际数学奥林匹克(IMO)资格考试中,GPT-4o 仅解决了 13% 的问题,而 o1 的得分高达 83%。
4. 版本与使用限制
o1 分为两个版本:o1-preview 和 o1-mini。由于训练成本高或其他原因,o1-preview 每周只能使用 30 次查询,而 o1-mini 则为 50 次。只有 GPT Plus 的付费用户才能使用这些版本。
5. 限额调整
9 月 17 日,OpenAI 宣布放宽了使用限额,o1-preview 现在为每周 50 次查询,o1-mini 改为每天 50 次查询。
6. 思考能力
o1 的一个显著特点是其“思考”能力。与之前版本强调快速给出结果不同,o1 在回答问题时会生成思维链,逐步推理,类似于人类的解题过程。这使得其回答时间较长,通常在几秒到几十秒之间。
7. 快思考与慢思考
o1 的慢思考与之前系列的快思考形成鲜明对比,正如丹尼尔·卡尼曼在《思考,快与慢》中所描述的:
- 快思考:通过联想记忆快速获取信息,使用简化的决策规则,容易出错。
- 慢思考:逻辑性强,能反复推敲问题,自我监督和矫正,正确率较高。
8. 提升易用性
o1 能够对问题进行深入推敲,降低了用户的使用难度。以前需要写出好的提示词才能获得满意答案,而现在 o1 更能理解提问者的意图,从而提升了易用性和效率。随着 AI 的快速发展,提示词工程师的角色可能面临挑战。
9. 功能局限
尽管 o1 的推理能力显著增强,但仍存在一些功能上的不足,例如不支持图像处理和联网查询,期待后续版本的改进。
10. 编码需求
对于编码任务,使用 o1-mini 已足够。o1-mini 比 o1-preview 便宜 80%,每周查询次数更多,且编码主要依赖推理而非广泛的世界知识,非常适合 o1-mini。
11. 实际应用
我使用 o1-mini 开发了一个 License 生成工具,前端采用 Vue3,后端使用 .NET8。通过逐步引导,从基本功能到添加登录和鉴权等,周末一个上午便完成了,几乎没有出错,确实展现了其强大能力。
12. 技术学习的层次
在 AI 迅速发展的背景下,我们应关注更重要的学习内容。我认为技术学习可以分为三层:
- 架构层:关注系统设计与构建,确保整体性和功能性,包括单体、微服务、分布式等。
- 工具层:编程语言和框架的使用,这部分可以由 AI 代替。
- 原理层:深入底层原理和概念,了解这些能在 AI 出现问题时不至于束手无策。
重要的学习内容应集中在架构层和原理层。