重磅消息!OpenAI推出文本生成视频模型Sora,支持生成最长1分钟视频!

北京时间2月16日凌晨,OpenAI 正式发布了其最新的文本到视频生成模型 Sora,标志着其在视频生成领域的加入,紧随 Runway、Pika、谷歌和 Meta 之后。

Sora生成视频示例

在山姆·奥特曼的消息发布后,OpenAI 工程师展示的 AI 生成视频效果引发了广泛关注,许多人感叹:好莱坞的时代是否已经结束?

Sora生成视频示例

OpenAI 声称,Sora 能够根据简短或详细的描述,甚至一张静态图片,生成类似电影的 1080p 场景,场景中包含多个角色、不同类型的动作和丰富的背景细节。

Sora的独特之处

Sora 在语言理解方面表现出色,能够准确解析用户的提示,并生成生动的角色以表达丰富的情感。此外,Sora 不仅能理解用户的要求,还能感知物理世界中的存在方式。

在官方博客中,OpenAI 提供了多个 Sora 生成的视频示例,展示了其令人印象深刻的效果,至少在与之前的文本生成视频技术相比时,效果显著提升。

Sora生成视频示例

对于初学者而言,Sora 可以生成多种风格的视频(如真实感、动画、黑白),最长可达一分钟,远超大多数文本到视频模型的时长。

这些视频保持了良好的连贯性,避免了常见的“人工智能怪异”现象,例如物体朝不可能的方向移动。

示例展示

以下是一些 Sora 生成的视频示例:

  • 中国龙年舞龙的视频生成。

舞龙示例

  • 输入提示:加州淘金热时期的历史镜头。

加州淘金热示例

  • 输入提示:玻璃球的特写视图,里面有一个禅宗花园。

玻璃球示例

  • 输入提示:一位 24 岁女性眨眼的极端特写。

女性特写示例

  • 输入提示:穿过东京郊区的火车窗外的倒影。

东京郊区示例

  • 输入提示:赛博朋克背景下机器人的生活故事。

赛博朋克示例

技术细节

在 Sora 推出后,OpenAI 迅速发布了技术报告,探讨了视频数据生成模型的大规模训练。研究人员在可变持续时间、分辨率和宽高比的视频和图像上联合训练了一个文本条件扩散模型。Sora 的最大模型能够生成长达一分钟的高质量视频。

OpenAI 认为,扩展视频生成模型是构建物理世界通用模拟器的一条有前途的途径。

技术细节示例

视觉数据转为 Patches

OpenAI 从大型语言模型的成功中汲取灵感,采用了将视觉数据转化为统一表示的方法。Sora 使用视觉 patches 作为训练生成各种类型视频和图像的有效表示。

视觉数据示例

视频压缩网络

OpenAI 训练了一个降低视觉数据维度的网络,将原始视频作为输入,并输出在时间和空间上压缩的潜在表示。Sora 在这个压缩的潜在空间中接受训练,生成视频。

时空潜在 patches

给定一个压缩的输入视频,OpenAI 提取一系列时空 patches,充当 Transformer 的 tokens。这一方案同样适用于图像,因为图像可视为单帧视频。

用于视频生成的缩放 Transformer

Sora 是一个扩散模型,能够根据输入噪声 patches 和文本提示等调节信息,预测原始的“干净”patches。Sora 的扩散 Transformer 在各个领域表现出色。

扩散模型示例

可变的持续时间,分辨率,宽高比

Sora 的训练方法允许其生成不同分辨率和长宽比的视频,提供了更大的灵活性。

可变分辨率示例

语言理解

Sora 的训练需要大量带有相应文本字幕的视频,研究团队将 DALL・E 3 中的重字幕技术应用于视频生成。

以图像和视频作为提示

Sora 还可以使用已有的图像或视频作为输入,执行各种图像和视频编辑任务。

👉 野卡 | 一分钟注册,轻松订阅海外线上服务

局限性讨论

尽管 Sora 展现了许多能力,但仍存在局限性,例如无法准确模拟某些物理现象。官方主页列举了该模型的其他常见失效模式。

局限性示例

Sora 的能力证明了持续扩大视频模型的规模是一个充满希望的方向,未来将助力物理和数字世界的更精确模拟。

(0)
上一篇 2025年4月20日
下一篇 2025年4月20日

相关推荐

  • AI对3-5年开发经验程序员的建议

    作为一名经验丰富的CTO,我深知程序员在职业道路上的成长并非一帆风顺。针对拥有3-5年开发经验的程序员,我想从职业和生活两个方面,给予一些具体的建议,希望能对你们的未来发展有所帮助…

    文章 2025年9月5日
  • ChatGPT Plus 续订与取消订阅注意事项

    ChatGPT Plus 上线已近一个月,续订的日子即将到来。用户可以选择是否继续订阅 ChatGPT Plus 服务。本文将分享续订和取消的一些注意事项,帮助您避免不必要的麻烦。…

    文章 2025年3月2日
  • 如何在国内订阅 ChatGPT Plus:四种实用方法

    随着 ChatGPT 在国内的普及,越来越多的用户希望升级为 ChatGPT Plus,以获得更高效的使用体验。然而,由于支付限制,国内用户在订阅 ChatGPT Plus 时可能…

    文章 2025年6月20日
  • AWS 免费套餐常见问题解答

    一般性问题 AWS 免费套餐使客户能够在各服务的指定限制内免费探索和试用 AWS 服务。免费套餐包含三种不同类型的产品:12 个月免费试用、永久免费和短期免费试用。12 个月免费服…

    文章 2025年7月13日
  • 如何以低成本使用 ChatGPT Plus 和 Claude Pro

    虽然 ChatGPT 在过去两年中备受关注,但随着时间的推移,Claude AI 显示出强劲的追赶势头,尤其是从 Claude 3.5 开始,其在编程领域的表现尤为突出。 信息更新…

    文章 2025年3月12日
  • 美国虚拟Visa信用卡申请指南

    美国虚拟Visa信用卡是一种便捷、安全的支付方式,广泛用于在线购物、国际支付以及订阅服务。它不仅适合美国本地用户,也为国际用户提供了一种高效的跨境支付解决方案。以下是如何申请美国虚…

    2025年2月9日
  • Perplexity AI的新工具让股市研究变得“愉悦”:它是如何实现的?

    千叶雄一郎/盖蒂图片社 我并不是一名日内交易者。上世纪90年代,我在芝加哥商品交易所参与过可可期货交易。尽管如此,我对股市有一定了解,并认为Perplexity AI这家快速发展的…

    文章 2025年2月11日
  • 1. Claude Pro 是什么?

    Claude Pro 是由 Anthropic 公司推出的高级人工智能助手服务。作为 Claude 免费版的升级版本,Claude Pro 为用户提供更强大的 AI 对话能力和更多…

    文章 2025年6月20日
  • Claude AI 注册指南(2025 亲测有效!)

    在人工智能迅速发展的时代,各种强大的AI工具层出不穷。其中,Claude AI作为一款备受关注的AI助手,吸引了众多用户的目光。本文将详细介绍Claude AI的注册流程,以及如何…

    文章 2025年3月12日
  • TikTok Ads 广告账户绑定信用卡支付教程:新手必看

    万事达和 Visa 信用卡是支付 TikTok Ads 广告费的主要方式,绑定过程非常简单,以下是详细步骤: 1. 登录 TikTok Ads 后台 首先,访问 TikTok Ad…

    2025年2月15日
  • Facebook注册失败的原因及解决方案

    有时候,用户在尝试注册Facebook账号时可能会遇到各种问题,导致注册失败或遇到困难。本文将分析Facebook注册失败的可能原因,并提供解决方法,帮助大家顺利完成注册流程。 一…

    2025年7月5日
  • 为什么选择 野卡 订阅 GPT-4?

    【2025年1月更新】野卡 订阅 GPT-4 防封号全攻略 随着 GPT-4 的普及,越来越多用户希望通过订阅来享受其强大的功能。然而,由于国内支付和 IP 问题,许多人面临封号风…

    2025年3月22日
  • 三步打造你的 Cursor

    Cursor 是一款近期备受关注的 AI IDE,迅速在社交媒体上走红,逐渐取代了 GitHub Copilot 的地位。其背后的公司 Anysphere 最近获得了 OpenAI…

    文章 2025年3月8日
  • 美区 Apple ID 注册与绑卡指南

    成功率100% 1. 准备工作 在开始之前,请确保您具备以下条件: 一个能接收短信的国内手机号 一个全新邮箱(未注册过 Apple ID 的邮箱),推荐使用 163 或 Gmail…

    2025年4月9日
  • 注册 ChatGPT Plus 和 OpenAI API 时的支付问题解决方案

    这篇文章详细介绍了申请 野卡 虚拟信用卡的过程(纯美国环境,100% 注册成功),使用邀请码:ACCPAY,开卡费用享受 88 折优惠。可以通过 野卡 | 一分钟注册,轻松订阅海外…

    文章 2025年4月28日
  • 取消订阅后,为什么我的账户又被续费了?如何申请退款?

    登录账户 继续操作即表示您同意我们的用户协议,并确认您已了解隐私政策。 邮箱或用户名 密码 忘记密码? 如果您是新用户,请注册。 输入来自身份验证应用的6位代码 您已为此账户设置了…

    文章 2025年7月26日
  • 什么是虚拟信用卡?优缺点解析

    数据泄露已成为新闻中的常事,因此值得考虑如何使用虚拟信用卡来帮助减少欺诈风险。虚拟信用卡号允许您在主要信用卡账户上进行交易,而无需暴露您的主要信用卡号码。您可以限制虚拟信用卡号仅供…

    2025年2月25日
  • 打破限制,畅享ChatGPT:深入了解虚拟信用卡野卡的智能服务

    目录 虚拟信用卡 ChatGPT OnlyFans Midjourney 虚拟信用卡 野卡 官方详细注册流程 野卡 是什么?可以为我们提供什么服务?虚拟信用卡及 野卡 使用教程 C…

    文章 2025年6月27日
  • PayPal Key:虚拟信用卡服务的全面解析与应用指南

    虚拟信用卡的出现为保护个人账户安全提供了极大的便利。传统信用卡使用固定卡号,若卡号被盗,可能导致账户资金风险。而虚拟信用卡则通过生成一次性卡号关联实际账户,完成消费后卡号即失效,有…

    2025年8月24日
  • 虚拟卡服务商与实体卡的比较:哪个更可靠?

    虚拟卡服务商有哪些? 目前市场上有多家虚拟卡服务商。以下是一些知名的虚拟卡服务: PayPal:全球知名的在线支付系统,提供虚拟卡服务,方便用户在没有信用卡的情况下进行在线支付。 …

    文章 2025年7月15日