重磅消息！OpenAI推出文本生成视频模型Sora，支持生成最长1分钟视频！

2025年4月20日下午3:14 • 文章

北京时间2月16日凌晨，OpenAI 正式发布了其最新的文本到视频生成模型 Sora，标志着其在视频生成领域的加入，紧随 Runway、Pika、谷歌和 Meta 之后。

Sora生成视频示例

在山姆·奥特曼的消息发布后，OpenAI 工程师展示的 AI 生成视频效果引发了广泛关注，许多人感叹：好莱坞的时代是否已经结束？

Sora生成视频示例

OpenAI 声称，Sora 能够根据简短或详细的描述，甚至一张静态图片，生成类似电影的 1080p 场景，场景中包含多个角色、不同类型的动作和丰富的背景细节。

Sora的独特之处

Sora 在语言理解方面表现出色，能够准确解析用户的提示，并生成生动的角色以表达丰富的情感。此外，Sora 不仅能理解用户的要求，还能感知物理世界中的存在方式。

在官方博客中，OpenAI 提供了多个 Sora 生成的视频示例，展示了其令人印象深刻的效果，至少在与之前的文本生成视频技术相比时，效果显著提升。

Sora生成视频示例

对于初学者而言，Sora 可以生成多种风格的视频（如真实感、动画、黑白），最长可达一分钟，远超大多数文本到视频模型的时长。

这些视频保持了良好的连贯性，避免了常见的“人工智能怪异”现象，例如物体朝不可能的方向移动。

示例展示

以下是一些 Sora 生成的视频示例：

中国龙年舞龙的视频生成。

舞龙示例

输入提示：加州淘金热时期的历史镜头。

加州淘金热示例

输入提示：玻璃球的特写视图，里面有一个禅宗花园。

玻璃球示例

输入提示：一位 24 岁女性眨眼的极端特写。

女性特写示例

输入提示：穿过东京郊区的火车窗外的倒影。

东京郊区示例

输入提示：赛博朋克背景下机器人的生活故事。

赛博朋克示例

技术细节

在 Sora 推出后，OpenAI 迅速发布了技术报告，探讨了视频数据生成模型的大规模训练。研究人员在可变持续时间、分辨率和宽高比的视频和图像上联合训练了一个文本条件扩散模型。Sora 的最大模型能够生成长达一分钟的高质量视频。

OpenAI 认为，扩展视频生成模型是构建物理世界通用模拟器的一条有前途的途径。

技术细节示例

视觉数据转为 Patches

OpenAI 从大型语言模型的成功中汲取灵感，采用了将视觉数据转化为统一表示的方法。Sora 使用视觉 patches 作为训练生成各种类型视频和图像的有效表示。

视觉数据示例

视频压缩网络

OpenAI 训练了一个降低视觉数据维度的网络，将原始视频作为输入，并输出在时间和空间上压缩的潜在表示。Sora 在这个压缩的潜在空间中接受训练，生成视频。

时空潜在 patches

给定一个压缩的输入视频，OpenAI 提取一系列时空 patches，充当 Transformer 的 tokens。这一方案同样适用于图像，因为图像可视为单帧视频。

用于视频生成的缩放 Transformer

Sora 是一个扩散模型，能够根据输入噪声 patches 和文本提示等调节信息，预测原始的“干净”patches。Sora 的扩散 Transformer 在各个领域表现出色。

扩散模型示例

可变的持续时间，分辨率，宽高比

Sora 的训练方法允许其生成不同分辨率和长宽比的视频，提供了更大的灵活性。

可变分辨率示例

语言理解

Sora 的训练需要大量带有相应文本字幕的视频，研究团队将 DALL・E 3 中的重字幕技术应用于视频生成。

以图像和视频作为提示

Sora 还可以使用已有的图像或视频作为输入，执行各种图像和视频编辑任务。

👉 野卡 | 一分钟注册，轻松订阅海外线上服务

局限性讨论

尽管 Sora 展现了许多能力，但仍存在局限性，例如无法准确模拟某些物理现象。官方主页列举了该模型的其他常见失效模式。

局限性示例

Sora 的能力证明了持续扩大视频模型的规模是一个充满希望的方向，未来将助力物理和数字世界的更精确模拟。

亚马逊卖家费用详解（包括隐藏费用）

上一篇 2025年4月20日

如何在国内使用 ChatGPT 4.0？升级 ChatGPT 4.0 的详细教程

下一篇 2025年4月20日

OnlyFans 订阅指南：使用虚拟信用卡支付

前言本文将分享如何使用野卡虚拟信用卡订阅 OnlyFans 服务，整个过程不超过 2 分钟。什么是 OnlyFans？ OnlyFans 被称为成人版 Instagram…

文章 2025年3月19日
Photoshop 免费试用版注册指南｜试用版的限制与优势

常见问题 Photoshop 可以免费使用吗？有没有办法先测试一下？不知道自己会不会学会 Photoshop？试用版有什么限制？引言对于想学习 Photoshop 的人来…

文章 2025年8月1日
初步了解 Stripe 支付平台

在最近的工作中，我接触到了多种国外支付平台，尤其是 Stripe。本文将分享我对 Stripe 平台的初步认识，主要基于其文档内容，后续会在实际使用中不断完善。基本介绍与其他支付…

文章 2025年7月9日
如何使用 Sora？新手指南

文章概述 Sora 是 OpenAI 于 2024 年 2 月 18 日发布的全新文生视频大模型。本文将为您详细介绍 Sora 的功能、准确性、技术突破及其对未来的影响。 Sora…

文章 2025年5月11日
ChatGPT Plus 订阅指南 – 国内用户可用

本文将为您详细介绍如何在国内成功订阅 ChatGPT Plus 会员，体验 GPT-4 的强大功能。背景介绍最近，我一直希望能够订阅 ChatGPT Plus 以体验 GPT-…

文章 2025年4月28日
Claude 注册指南：轻松上手的步骤

随着人工智能技术的不断进步，越来越多的智能助手进入我们的生活。其中，Claude 作为一款强大的人工智能助手，受到了广泛的欢迎。然而，对于新手用户来说，Claude 的注册流程可能…

文章 2025年5月10日
文章

【全面指南】如何在Patreon上订阅？是否需要银行卡？Patreon虚拟信用卡购买支付教程

重要提示推荐使用野卡虚拟信用卡，支持一键升级GPT4.0，兼容Midjourney等服务，现在开卡可享受独家优惠！具体教程请查看：野卡使用教程其他精选文章 Sora 【推荐…

2025年4月27日
Google Play 支持的付款方式

您可以通过 Google 帐号中的付款方式在 Google Play 上购买应用和数字内容。如果您是首次购物，系统会将您使用的付款方式添加到您的 Google 帐号中。更新付款设…

文章 2025年3月29日
文章

OpenAI 发布 ChatGPT O1 Pro：订阅费用翻倍，月费达 200 美元

在日常生活和学习中，我一直使用每月 20 美元的 ChatGPT Plus 订阅，确实帮助我解决了许多问题。ChatGPT 的出现，让我能够随时向这位几乎无所不知的“专家”提问，尽…

2025年3月9日
文章

PayPal Key – PayPal 的虚拟信用卡服务详解

虚拟信用卡，或称虚拟卡号，在我们的日常生活中发挥着重要作用。传统信用卡有固定的卡号，一旦被盗，其他人可能会利用这些信息进行消费。虚拟卡号的设计初衷就是为了避免这种风险。例如，在网上…

2025年6月28日
文章

如何在国内开通 Twitter Blue：详细的推特会员付费订阅指南

最近，有小伙伴私信我，询问推特平台无法正常浏览推文的原因。这是因为推特官网推出了“临时阅读限制”，已验证账户每天只能浏览 6000 个帖子，而未验证账户每天只能浏览 600 个帖子…

2025年7月26日
文章

ChatGPT 订阅指南：快速稳定的购买方法与避坑技巧

欢迎访问 ChatGPT 中文教程网，学习 ChatGPT 相关知识，以下是正文内容：购买 ChatGPT 的全流程包括以下几个步骤：访问 OpenAI 官方网站并注册一个账户。…

2025年7月12日
野卡虚拟信用卡概述

野卡虚拟信用卡是由野卡公司与海外银行合作推出的一种创新支付工具。该平台由广州壁虎信息科技有限公司运营，并已通过国家工信部 ICP 备案，确保其合法性和正规性。野卡虚拟…

文章 2025年5月6日
文章

Claude 国内注册全攻略：轻松注册与封号应对

什么是 Claude？ Claude 是由 Anthropic 公司推出的高级人工智能语言模型，旨在提供高效的 AI 交互体验。其主要版本包括 Claude 3，相较于 OpenA…

2025年4月12日
文章

TikTok Ads 广告账户绑定信用卡支付教程：新手必看

万事达和 Visa 信用卡是支付 TikTok Ads 广告费的主要方式，绑定过程非常简单，以下是详细步骤： 1. 登录 TikTok Ads 后台首先，访问 TikTok Ad…

2025年2月15日
文章

野卡使用指南：轻松订阅国外服务的保姆级教程

1. 什么是虚拟信用卡野卡虚拟信用卡提供快速、安全的在线支付解决方案，支持通过云闪付充值，不收取消费和提现手续费。它特设美国网络环境和英国手机号服务，并提供直接客服支持，适合全…

2025年7月12日
文章

ChatGPT Plus升级与OpenAI API充值：接受哪些信用卡？

本文将详细解答关于ChatGPT Plus升级及OpenAI API充值时的支付方式，包括国内银联卡、Visa外币卡和香港信用卡的接受情况，帮助你顺利完成支付。随着ChatGPT…

2025年7月5日
如何解决 Facebook 广告投放量不足的问题？

在刚入行 Facebook 广告时，我经历了两个月的投放，结果是只花钱不赚钱。虽然偶尔有成交，但我觉得那单是“瞎猫碰上死耗子”，因为当时缺乏分析能力，没有进行有效的复盘。今天，我想…

文章 2025年4月3日
GitHub Copilot 与 Cursor 的开源新选择：Void 编辑器能否颠覆现状？

你是否在使用 GitHub Copilot 或 Cursor 时，体验过那强大的代码自动补全，却又因功能限制和高昂的订阅费而感到犹豫？如今，一款全新的开源免费 AI 代码助手——V…

文章 2025年5月8日
文章

【30秒搞定】ChatGPT Team：官方升级教程

ChatGPT Team是OpenAI在2023年下半年推出的一项会员计划，旨在为企业和团队用户提供更专业和高级的服务。与ChatGPT Plus版本相比，Team版本不仅可以访…

2025年9月3日