OpenAI推出AI智能体——Operator，预计年底将普及电脑操作

2025年2月19日上午4:09 • 文章

2024年10月，Claude 3.5 Sonnet推出了一项突破性的新功能：计算机使用能力（computer use）。开发者可以指导Claude像人类一样使用电脑，包括查看屏幕、移动鼠标、点击按钮和输入文字等。

Claude能够理解复杂指令，自动完成一系列操作，如浏览网页、查找信息、填写表格，甚至进行软件测试和开发。用户只需静静观看，仿佛有真人在远程操控电脑，十分神奇。

2025年初，人工智能公司OpenAI举行了一场备受期待的直播活动，发布了首款AI智能体——Operator。该智能体能够代理用户执行基于网页的操作，真正实现像人类一样使用网页浏览器。

与传统的“问一句、答一句”的聊天机器人不同，AI智能体（AI agent）能够在有限的人类监督下完成设定任务，被广泛视为AI生产力的下一个里程碑。在OpenAI通往通用人工智能（AGI）的五个步骤中，AI智能体是继聊天机器人和推理机器人之后的第三步，也是全新的一步。

OpenAI的山姆·奥尔特曼介绍，ChatGPT Pro用户（每月200美元）将能使用“研究预览版”的Operator。未来，Pro用户将逐步扩展到更多地区，几个月后，ChatGPT Plus用户也将能够使用。同时，未来几周和几个月内，还将发布更多的AI代理。

什么是Operator？

Operator由一个名为CUA（计算机使用代理）的新模型驱动，结合了GPT-4o的视觉能力和通过强化学习实现的高级推理。Operator能够“看见”网页（截图），并使用鼠标和键盘进行所有允许的操作。在操作过程中，如果遇到困难，模型会调用推理能力进行自我纠正；若仍无法解决问题，则会将控制权交还给人类。

要理解这种新事物，生动的案例是最好的方式。

Operator的界面与聊天机器人ChatGPT类似，最大的区别在于它能够调用“AI代理”完成用户的指令。在演示案例中，用户只需在对话框中输入“给我订一个XX饭店今晚19点的桌子”，AI代理便会自动打开网页，进入预订网站，搜索餐厅并完成预订。

如果用户所需的时段已被订完，AI会询问：“19点的桌子订完了，19点45分的桌子还有，要不要订？”

OpenAI也提醒用户，尽管Operator是市面上最强的AI代理，但与人类相比仍有差距。例如，在使用浏览器的基准测试中，OpenAI CUA模型的评分为58.1%，而人类的水平可达78%。因此，这项新技术仍可能出现错误，但在未来几个月内将持续改进。

目前，Operator擅长处理短任务和重复性操作，但在复杂任务（如幻灯片制作、日历管理）上表现不佳。例如，处理多步骤任务时，模型可能因界面变化或意外事件而失败。此外，在处理长DNA序列、随机字符串（如API密钥）或复杂代码时，Operator的光学字符识别（OCR）系统表现不佳。

这是因为任务超出了训练数据的范围，导致模型在识别和操作内容时容易出错。尽管OpenAI已采取多种措施防止提示注入攻击和恶意指令，但Operator在面对新型对抗性攻击时仍可能表现出脆弱性。

然而，AI这一趋势正在快速进化，预计到2025年底，各大AI公司推出的AI智能体都将能够熟练操作电脑，实现人机互动。

👉 野卡 | 一分钟注册，轻松订阅海外线上服务

Claude 3 在国内的使用指南与镜像地址分享

上一篇 2025年2月19日

ChatGPT订阅价格及套餐选择指南

下一篇 2025年2月19日

盘点九大热门加密货币虚拟信用卡

来源：白露会客厅近日，香港加密支付服务商 RedotPay 的应用程序试用引起了笔者的关注。成功完成账号注册与加密货币虚拟卡申请后，流畅的使用体验让人感叹：Web3 的未来正逐步…

文章 2025年7月20日
文章

如何升级到 ChatGPT-4 Turbo？体验最新功能的指南

本文将为您详细介绍如何将您的 GPT-4 升级到 GPT-4 Turbo，并检查您当前的 GPT-4 Turbo 是否为最新版本（GPT-4-Turbo-2024-04-09）。 …

2025年3月1日
X Premium 详解：付费 Twitter 账户的功能与使用方法

大多数用户可能都在免费使用 X（前身为 Twitter）。然而，为了增加收入，拥有者埃隆·马斯克重新设计并推出了多个付费版本，提供更高级的功能。通过月度或年度订阅，X Basic…

文章 2025年3月6日
Ultra Mobile 常规电话卡：全球免费电话与短信服务（开户赠送 $25）

黑五活动更新【2024.11 更新】黑五活动预热，套餐费用最高可享受 25% 折扣，并可与推荐奖励（$25 话费）叠加。开户奖励提升【2024.9 更新】通过推荐链接开户奖励…

文章 2025年8月20日
文章

🚀 Perplexica – 一款 AI 驱动的搜索引擎 🔎

目录概述 Perplexica 是一款开源的 AI 驱动搜索工具，能够深入互联网寻找答案。受 Perplexity AI 启发，它不仅仅是一个搜索引擎，还能理解您的问题。它利用先…

2025年5月5日
文章

美国虚拟信用卡539186的开卡渠道解析

539186虚拟信用卡是由美国萨顿银行（Sutton Bank）发行的一种万事达虚拟信用卡，属于借记卡类型，且为预付费卡。开卡渠道概述目前市场上有多种开卡渠道，通常来说，容易开…

2025年7月18日
文章

Claude 3 免费体验与 Opus 订阅指南

Claude 3 的发布引起了广泛关注，如果你还不太了解 Claude 3，可以通过以下链接快速获取信息：GPT4 统治时代成为过去式，Claude3 登顶第一。本文将详细介绍 …

2025年7月23日
如何使用 PayPal 实现循环扣款（订阅）功能

起因由于业务需求需要集成 PayPal 的循环扣款功能，经过在百度和 Google 上的搜索，除了官网外未能找到相关的开发教程。最终，我在 PayPal 的文档上花费了两天时间成…

文章 2025年5月21日
文章

Cursor AI简介：如何订阅和升级Cursor Pro Plus？

什么是Cursor？ Cursor是一款集成了AI的开发环境（IDE），基于vscode的开源代码进行修改，非插件形式。使用Cursor，用户可以更快速地构建相关技术栈的demo，…

2025年6月30日
文章

专家与ChatGPT：谁的建议更具可信度？

ChatGPT的聊天机器人彻底火出了圈。上线仅仅2个月，其活跃用户已突破一亿，曾创下无数增长奇迹的TikTok都望尘莫及。改论文、敲代码、写文案……只有你想不到的，没有人家办不…

2025年6月3日
文章

ChatGPT与Perplexity AI：哪一个更胜一筹？

随着人工智能（AI）的快速发展，生成型AI的崛起正在改变我们在互联网上获取信息的方式。OpenAI推出的ChatGPT引发了广泛关注，许多AI搜索工具和聊天机器人也因此受到瞩目，因…

2025年2月7日
文章

轻松扩展图像！Photoshop AI 功能“生成性填充”的使用指南及低价订阅方法

在之前的文章中，我们介绍了 Adobe 将 AI 绘图工具「Adobe Firefly」整合进 Photoshop 的消息。现在，Photoshop beta 版本已支持 Fire…

2025年6月1日
文章

干货收藏 _ 精通ChatGPT提示词的技巧：从新手到高手！

前言提示词决定了 ChatGPT 的输出质量。换句话说，GPT 生成的答案完全依赖于你如何“提问”和“引导”。如果你能提出清晰的问题并有效引导，ChatGPT 将为你生成令人满意…

2025年7月30日
如何开通ChatGPT 3.5及升级至GPT-4.0：最新教程（2025年更新）

升级至GPT-4的步骤 2023年11月13日，OpenAI发布了ChatGPT 4，为用户带来了许多新机遇。如果您希望体验这些新功能，尽快订阅并升级至GPT-4是必要的。以下是详…

文章 2025年8月4日
Windsurf：AI开发的新宠，逐步取代Cursor

在AI技术迅速发展的今天，各种智能开发工具如雨后春笋般涌现，为开发者们提供了前所未有的便利。其中，Windsurf作为一款集智能与高效于一体的全自动开发工具，正逐渐崭露头角，成为C…

文章 2025年4月21日
【全面指南】如何在 Fantia 上订阅与充值？

说明：由于 Fantia 的特殊性，其可能会反过来影响野卡信用卡在银行及各支付渠道的评价。为了不影响野卡信用卡的正常使用，后续野卡信用卡开卡教程可能不会支持 Fanti…

文章 2025年5月3日
Adobe Acrobat 计划与定价

物超所值 Acrobat Pro 年度订阅，14天内取消订阅可获得全额退款。如果您在14天后才取消，则需支付相关费用。不需要绑定一年。14天内取消订阅可获得全额退款。可随时免…

文章 2025年3月31日
文章

如何使用虚拟信用卡绑定 Google Pay，享受更便捷的支付体验

Google Pay 是谷歌推出的一款支付工具，类似于支付宝等第三方支付应用，旨在帮助用户添加和管理多种付款方式，包括银行借记卡、信用卡、虚拟卡、礼品卡、交通卡、数字钱包和会员卡等…

2025年8月26日
文章

POE Pro 付费订阅与代充服务详解

POE 代充服务说明 Poe 账号会员订阅购买与代充值服务，支持 GPT-4-32K。我们提供高质量的 Poe 版 GPT-4 / Claude+ 代充服务，使用正规 VISA/…

2025年2月8日
Poe ChatGPT与AI Bot提问技巧指南 – 收费版更新

Poe 现已推出桌面版！这使得无论是 iOS 还是 Android 用户都能更方便地使用 Poe。最新更新中，Poe 加入了 GPT-4 和 Claude+，但免费版的使用次数有限…

文章 2025年8月5日

OpenAI推出AI智能体——Operator，预计年底将普及电脑操作

什么是Operator？

相关推荐