5 月 13 日,OpenAI 发布了最新的 ChatGPT 模型——GPT-4o。与之前的版本相比,GPT-4o 的响应时间提高了一倍,能够理解文本、图像、音频和视频。本文将全面介绍 OpenAI 最新模型 GPT-4o 的基本信息,并指导如何将 GPT-4o API 集成到自己的服务中。
如果你希望在项目中实现 GPT-4o 或利用它开发新项目,我们推荐使用 Apifox,这是一款全能的 API 管理工具。Apifox 提供便捷的 OpenAI API 访问,帮助你在项目中快速使用、测试和实施 GPT-4o API。
什么是 GPT-4o?
GPT-4o 是 OpenAI 于 5 月 13 日宣布的最新 AI 模型。“4o”中的“o”代表“omni”,意为“全方位的”。与 ChatGPT 主要基于文本和图像的交互不同,GPT-4o 允许用户通过文本、音频、图像和视频的组合进行交互。
GPT-4o 的特点
OpenAI 的最新模型 GPT-4o 相较于之前的模型有哪些显著特点呢?
响应时间缩短
根据 OpenAI 的说法,GPT-4o 在与人类对话时的响应时间显著缩短。之前的 GPT-3.5 平均延迟为 2.8 秒,GPT-4 为 5.4 秒,而最新的 GPT-4o 仅需 2.32 秒,平均响应时间为 3.20 秒,几乎与人类的反应速度相当。
理解音频情感标记
GPT-4o 具备理解说话者音频标记的能力,能够识别语气和背景噪音,从而提升对话的自然性和信息的完整性。
Token 花费减少
GPT-4o 在日语等 20 种语言中压缩了使用的标记数量。例如,交互“你好,我叫 GPT-4o,我是一种新型语言模型,很高兴认识你”的 Tokens 数量从 37 个减少到 24 个。
基本免费
GPT-4o 发布后,之前的付费服务(如 GPT、GPT Store 和 GPT-4)将免费提供。
提供桌面客户端
GPT-4o 模型公告中发布了新的 macOS ChatGPT 桌面应用程序,Windows 应用程序预计将在今年下半年发布。
GPT-4o API 的使用
在开发 Web 应用程序时,使用 API 将 AI 功能集成到服务中非常方便。随着 GPT-4o 模型的发布,我们可以通过 API 将其出色功能引入到自己的服务中。
GPT-4o API 可用性
根据 OpenAI 的最新信息,GPT-4o 模型 API 已在 Chat Completions API、Assistants API 和 Batch API 中作为文本和视觉模型提供。
GPT-4o API 升级
与之前的 ChatGPT 模型 API 相比,GPT-4o API 具有以下优势:
- 更智能:在文本分析、推理、编程能力上,提供 GPT-4 Turbo 级别的性能。
- 响应速度提升:响应速度提升 2 倍。
- 价格减半:输入和输出标记的价格比 GPT-4 Turbo 便宜 50%。
- 速率限制值提高:速度限制比 GPT-4 Turbo 高出 5 倍,最高可达每分钟 1000 万个 Tokens。
- 视觉能力优化:视觉能力全面优化。
- 非英语语言处理能力提升:优化了对非英语语言的处理。
GPT-4o API 定价
使用 GPT-4o API 模型的成本如下:
- 输入:5 美元 / 1M tokens
- 输出:15 美元 / 1M tokens
视觉处理的成本基于图像的宽度和高度计算。
使用 GPT-4o API 的注意事项
在使用 GPT-4o API 或从其他版本切换时,需要注意以下几点:
- GPT-4o API 可以通过感知能力理解没有音频的视频。
- 截至 2024 年 5 月 14 日,GPT-4o API 暂不支持音频模式。
- 截至 2024 年 5 月 14 日,GPT-4o API 暂不支持图像生成。
- OpenAI 建议用户在考虑切换之前比较输出并尝试 GPT-4o。
使用 Apifox 管理 GPT-4o API
使用 GPT-4o API 时,API 调试和管理等任务非常重要。通过使用 Apifox,你可以更方便、高效地管理任何 API。
获取 OpenAI API 密钥使用 GPT-4o API
要开始使用 GPT-4o API,你首先需要获取 OpenAI API 密钥。以下是获取 API 密钥的步骤:
1. 注册 OpenAI 账户
访问 OpenAI 官网,点击右上角“Get Started”按钮创建账户。
2. 获取 OpenAI API 密钥
创建账户后,访问 OpenAI 的 API 密钥页面并登录,点击“Create new secret key”生成新的 API 密钥。
生成的 API 密钥会立即显示在屏幕上,请务必记录并安全存储。
方便地测试和管理 GPT-4o API
对于想调用 GPT-4o API 的用户来说,Apifox 是一个非常方便的工具。你可以在 OpenAI API 项目中选择聊天(Chat),在请求 Body 中将模型指定为“gpt-4o”。
实战演示:将 GPT-4o API 与 Apifox 结合使用
在 Apifox 上访问 OpenAI API 项目时,选择 Chat Completions API,输入 HTTP 方法和端点 URL。在“Body”选项卡中,以 JSON 格式写入要发送的消息,并指定模型为“gpt-4o”。
切换到“Headers”选项卡,添加授权参数以进行身份验证,输入你的 API 密钥,然后单击“发送”按钮。
在 Apifox 中,你可以将 OpenAI API 密钥存储为环境变量,以后可以直接引用,避免重复输入。
总结
在本文中,我们详细介绍了 OpenAI 的最新模型 GPT-4o。
- GPT-4o 的响应时间比之前的版本快一倍
- 可以理解文本、图像、音频和视频
- 使用 Tokens 数量减少
- GPT-4o API 具有更高的智能
- 响应速度加快 2 倍
- 定价便宜 50%
- 速率限制提高 5 倍
- 改进的视觉功能
- 非英语语言处理能力提升
要使用 GPT-4o API,你需要创建 OpenAI 帐户并获取 API 密钥。使用 Apifox,你可以轻松测试和管理 GPT-4o API。Apifox 提供了一个涵盖 GPT-4o API 规范的项目,你可以将 API 密钥存储为环境变量以避免重复输入。
将来,GPT-4o API 中将添加音频支持。通过利用 GPT-4o 的优秀功能并将其融入到你的服务中,你可以提供更好的 AI 体验。