ChatGPT时代:AI未来应用生态的探索

AI的世界大致可以分为三个主要领域(当然,这是一种简化的说法):

  1. 大型语言模型
    这些模型属于通用类型,如GPT-4或Chinchilla。大型语言模型(LLM)会吸收来自网络(或其他文本/语言来源)的内容,并将其转化为可以执行多种任务的模型,例如生成法律文件摘要、使用搜索引擎或作为友好的聊天机器人。

  2. 图像生成
    包括Midjourney、Dall-E或Stable Diffusion等模型,以及一些易用的视频制作工具和NeRF等3D模型。这些模型允许用户输入提示以生成图像。

  3. 其他技术
    这一类涵盖的技术和市场范畴非常广泛,包括机器人技术、自动驾驶汽车、蛋白质折叠等众多应用领域。将这些技术统统归为一类显然是不合理的,因为它们在模型架构和市场需求上存在显著差异。为了简化讨论,本文将暂时忽略其他技术的细节。

当谈到“生成式人工智能”时,往往会将这些领域混为一谈。实际上,每个市场都有不同的底层AI模型架构、计算需求、扩展需求、质量标准和应用领域。重要的是将它们区分开来,以便推测它们可能带来的未来影响。

图像生成的潜在影响

图像生成可能会改变多个领域,包括:

  • 社交产品和图像(例如Lensa类产品的未来版本,或与核心社交平台的集成)
  • 图形与可视化设计
  • 电影、漫画、动漫
  • 视频游戏
  • CAD(计算机辅助设计)
  • 建筑设计
  • 电子商务
  • 其他领域

当然,高性能视频(和语音)也可以开辟更多的应用领域。

尽管图像的社会变革应用范围广泛,但在短期内与文本和语言的应用范畴相比,仍显得较小。然而,随着视频、语音等其他接口的发展,这种情况可能会逐渐改变。目前,大多数B2B应用以语言为中心(文本和少量语音),而消费者应用则是混合型的(如Twitter、Facebook、TikTok、YouTube,电子商务如Amazon、Airbnb等)。

尽管图像生成的应用机会巨大,但如果研究相关公司的市值与收入,图像生成的潜在应用与语言生成相比仍显得微不足道。语言是所有B2B交互、社交产品、商业及其他领域的核心部分。从经济角度来看,LLM在短期内的重要性可能要比图像生成高几个数量级,尽管图像生成也是一个非常重要的领域。

与LLM相比,图像生成的建模成本更低

一般来说,已经取得巨大成功的图像生成模型只需相对较少的资金和计算资源即可完成训练。例如,最新版的Stable Diffusion的训练成本可能仅需数十万到数百万美元的GPU时间。

LLM与基础模型的应用

  • 搜索
  • 大多数B2B交互、销售、ERP、文档管理、电子邮件等
  • 代码、数据交互、代码生成、SQL、Excel等
  • 金融
  • 大部分社交与消费产品
  • 聊天、短信及其他应用
  • “一切的副驾”——所有白领工作(法律、会计、医学等)

在这些领域中,哪些需要大型语言模型,哪些需要较小规模的小众语言模型,仍然是一个悬而未决的问题。迄今为止,LLM在某些领域(但并非所有领域)似乎优于小众模型。

大型语言模型及其潜在的终端市场结构存在多种可能的路径。市场结构非常重要,因为它决定了生态系统中的经济赢家和人才赢家(谁收割了所有的收入、人才、利润、市值与创新)。

👉 野卡 | 一分钟注册,轻松订阅海外线上服务

(0)
上一篇 5天前
下一篇 5天前

相关推荐