OLMo:真正的100%开源大模型

OLMo是由AI2推出的一个真正的非营利性开源项目,致力于实现完全开源,100%开放的目标。

完整的预训练数据

OLMo不仅开放了其完整的预训练数据——包含3万亿token的Dolma数据集,还提供了训练代码、模型权重、推理代码、训练指标和完整日志等所有原始数据。这种开放程度使研究人员能够完全复现模型训练过程,深入理解模型的性能表现,并根据需要对模型进行微调。

OLMo与其他开源语言模型的不同之处
OLMo(Open Language Model)与其他开源语言模型的不同之处在于其“完全开放的框架”。

OLMo框架的组成

OLMo框架包括以下几个关键组成部分:

  1. 完整的预训练数据:OLMo项目提供了AI2的Dolma数据集,这是一个包含三万亿token的开放语料库,专为语言模型的预训练而设计。研究人员不仅可以访问模型本身,还能获得用于训练这些模型的原始数据,从而深入理解模型的学习基础,甚至重新训练或调整模型以适应特定的研究需求。

  2. 训练代码和模型权重:OLMo框架提供了四种不同变体模型的完整模型权重,每种模型至少训练到2万亿令牌。除了数据,OLMo还提供了训练代码、推理代码、训练指标和日志。这种开放性使研究人员能够完全复现模型训练过程,理解模型的性能表现,并根据需要对模型进行微调。

  3. 评估工具的提供:项目包含了开发过程中使用的评估套件,以及500多个模型的检查点,每1000步训练过程中的每一个都有,还有评估代码,这些都属于Catwalk项目的一部分。这使得研究人员可以使用相同的工具来评估自己的模型或对OLMo模型进行进一步的分析。

模型参数和架构

OLMo提供了不同规模的模型变体,具体包括:

  • 1B(10亿参数)模型:具有16层,每层2048个隐藏单元,16个注意力头,训练了至少2万亿个令牌。
  • 7B(70亿参数)模型:包含32层,每层4086个隐藏单元,32个注意力头,训练了约2.46万亿个令牌。
  • 65B(650亿参数)模型:计划包含80层,每层8192个隐藏单元,64个注意力头(文章撰写时仍在训练中)。

这些模型采用了基于Vaswani等(2017年)的解码器仅Transformer架构,并进行了多项改进,例如:

  • 不使用偏置项,以提高训练稳定性。
  • 采用非参数层归一化。
  • 使用SwiGLU激活函数代替ReLU。
  • 引入旋转位置嵌入(RoPE)。
  • 使用修改版的BPE-based标记器,以减少个人可识别信息(PII)。

预训练数据:Dolma

OLMo使用的Dolma数据集是一个多源、多样性的3万亿令牌语料库,涵盖了从7种不同数据源获取的5亿文档。这个数据集旨在促进语言模型预训练的开放研究,并包括网络页面、代码、社交媒体、STEM论文、书籍和百科资料等内容。

性能评估

OLMo 7B在许多生成和阅读理解任务(如truthfulQA)上与Llama 2不相上下,但在流行的问答任务(如MMLU或Big-bench Hard)上略微落后。使用AI2的Paloma和可用检查点,分析了模型预测语言的能力与模型规模因素(如训练令牌数)之间的关系。Paloma试图通过平等地采样每个领域来更均衡地代表LLM使用的许多领域。

👉 野卡 | 一分钟注册,轻松订阅海外线上服务

项目地址

OLMo项目地址

(0)
上一篇 2025年8月27日
下一篇 2025年8月27日

相关推荐

  • 如何使用 PayPal 实现循环扣款(订阅)功能

    起因 由于业务需求需要集成 PayPal 的循环扣款功能,经过在百度和 Google 上的搜索,除了官网外未能找到相关的开发教程。最终,我在 PayPal 的文档上花费了两天时间成…

    文章 2025年5月21日
  • 虚拟信用卡在亚马逊美国站购物测试

    在亚马逊购物的老手们都知道,测评一直是最有效且快速的推广方式。通过测评,可以为自己的商品增加销量,优化产品列表,留下优质评论,甚至打压竞争对手,帮助自己的商品脱颖而出。 测试环境 …

    2025年4月5日
  • 虚拟信用卡与预付卡(礼品卡)的用途解析

    经常有网友询问:“虚拟信用卡有什么用?为什么要研究这些虚拟卡?”为此,我花了一些时间总结了一些常见的用途。在正式开始之前,先简单介绍一下虚拟信用卡与预付卡(礼品卡)的区别。 虚拟信…

    2025年5月29日
  • 如何选择最适合你的Adobe版本?轻松决策!

    随着数字化时代的到来,Adobe软件已成为设计师、摄影师、视频编辑人员及众多创意工作者的必备工具。无论是图形设计、视频编辑,还是网页设计,Adobe软件凭借其强大的功能和专业的操作…

    文章 2025年4月12日
  • 《Suno AI》常见问题解答

    Suno AI 是一个专业的高质量 AI 歌曲和音乐创作平台,用户只需输入简单的文本提示,即可根据流派风格和歌词生成带有人声的歌曲。以下是关于《Suno AI》的常见问题解答,欢迎…

    2025年5月4日
  • YouTube Premium 详解(附开通指南)

    YouTube 简介 YouTube 是美国 Alphabet 旗下的视频分享平台,现已成为全球最大的视频搜索和分享网站。用户可以在此上传、观看、分享和评论视频。该网站于 2005…

    文章 2025年7月1日
  • 野卡虚拟信用卡:轻松注册与使用指南

    虚拟信用卡是一种没有实体卡形式的信用卡,与传统的实体信用卡相比,具有以下优势: 安全性高:由于没有实体卡的存在,虚拟信用卡可以减少丢失或被盗的风险。它提供一次性使用的卡号、有效期和…

    2025年8月21日
  • 全球最大的音乐流媒体平台:Spotify 订阅指南

    作为全球最大的音乐流媒体服务商,Spotify 以其出色的设计和精准的音乐推荐算法吸引了众多用户。然而,Spotify 目前尚未在大陆地区提供服务。如果你希望在 Spotify 上…

    文章 2025年5月15日
  • 虚拟信用卡充值指南

    如何为虚拟运营商充值话费 虚拟运营商的充值方法如下: 登录网上营业厅首页,点击“交费充值” > “交话费”。 在手机营业厅客户端中,选择“服务” > “交费” >…

    文章 2025年5月30日
  • GPT-4o API 使用指南:快速调用的实现

    5 月 13 日,OpenAI 发布了最新的 ChatGPT 模型——GPT-4o。与之前的版本相比,GPT-4o 的响应时间提高了一倍,能够理解文本、图像、音频和视频。本文将全面…

    2025年4月27日
  • (最新教程)如何使用支付宝订阅Cursor Pro Plus

    目前,使用Cursor的用户只需下载安装即可,但基础版的使用期限仅为两周。如果希望继续使用,您需要订阅 Pro Plus 或企业版。 如何订阅Cursor Pro Plus? 由于…

    2025年7月3日
  • 如何购买正版Adobe软件

    在数字化时代,Adobe软件已成为许多人工作和创造的必备工具。然而,部分用户可能会选择通过非正规渠道获取Adobe软件,这种做法不仅违法,还会带来一系列不必要的风险。因此,购买正版…

    文章 2025年8月18日
  • ChatGPT Plus 订阅与购买指南

    自从 ChatGPT 发布以来,许多用户已经体验到了其强大的功能,深深被其魅力所吸引。然而,仍有不少用户在注册和升级 ChatGPT 时遇到困难。本文将为您提供详细的解决方案,帮助…

    文章 2025年3月5日
  • 野卡:必备的虚拟信用卡工具,助力海外支付与OpenAI ChatGPT专区

    在全球化的今天,便捷、安全地使用海外支付服务是许多企业和个人关注的焦点。野卡作为一款出海必备的虚拟信用卡解决方案,不仅能够快速开通,还提供了强大的安全保障。本文将详细介绍野卡的强大…

    2025年2月4日
  • 如何关闭亚马逊自动续费及退款指南

    关闭亚马逊自动续费并申请退款 要关闭亚马逊的自动续费功能并申请退款,请按照以下步骤操作: 登录您的亚马逊账户。 在页面右上方,将鼠标悬停在您的账户名上,从下拉菜单中选择“您的账户”…

    文章 2025年2月16日
  • 开发者关注的 ChatGPT API 额度、Token 和价格

    ChatGPT 官网提供了 Web 端 ai.com,供普通用户使用。此外,他们还为开发者开放了 API 接口,方便开发者利用 ChatGPT 的 API 能力实现更多个性化需求。…

    2025年3月13日
  • 如何免费获取一年阿里云国际服务器

    阿里云国际试用介绍 阿里云国际提供了免费试用的机会,用户可以通过注册体验其服务。然而,许多用户在支付方式验证时遇到困难。本文将介绍一种使用虚拟卡进行阿里云国际支付验证的方法。 申请…

    2025年7月17日
  • Cursor AI 的 15 个实用避坑技巧

    在人工智能迅速发展的今天,AI 辅助编程工具正在改变我们的工作方式。Cursor 作为其中的佼佼者,吸引了众多开发者和非开发者的关注。本文将深入探讨 Cursor 的使用体验,为您…

    文章 2025年6月11日
  • Midjourney简介:如何使用及注册账号?国内用户的使用指南

    什么是Midjourney? OpenAI发布的ChatGPT4引领了聊天机器人的竞争浪潮,随后谷歌推出了自己的AI聊天机器人Bard,微软也推出了Bing Chat,百度则推出了…

    2025年4月22日
  • 「全面指南」如何注册ChatGPT API账户并获取GPT-4 API访问权限及开通Plus会员

    首先,我们来澄清一下API和Plus会员之间的功能和关系: API Key:这是OpenAI提供给开发者的接口,用于请求调用GPT系列(如GPT-3.5、GPT-4)大模型。Cha…

    文章 2025年2月24日