OLMo:真正的100%开源大模型

OLMo是由AI2推出的一个真正的非营利性开源项目,致力于实现完全开源,100%开放的目标。

完整的预训练数据

OLMo不仅开放了其完整的预训练数据——包含3万亿token的Dolma数据集,还提供了训练代码、模型权重、推理代码、训练指标和完整日志等所有原始数据。这种开放程度使研究人员能够完全复现模型训练过程,深入理解模型的性能表现,并根据需要对模型进行微调。

OLMo与其他开源语言模型的不同之处
OLMo(Open Language Model)与其他开源语言模型的不同之处在于其“完全开放的框架”。

OLMo框架的组成

OLMo框架包括以下几个关键组成部分:

  1. 完整的预训练数据:OLMo项目提供了AI2的Dolma数据集,这是一个包含三万亿token的开放语料库,专为语言模型的预训练而设计。研究人员不仅可以访问模型本身,还能获得用于训练这些模型的原始数据,从而深入理解模型的学习基础,甚至重新训练或调整模型以适应特定的研究需求。

  2. 训练代码和模型权重:OLMo框架提供了四种不同变体模型的完整模型权重,每种模型至少训练到2万亿令牌。除了数据,OLMo还提供了训练代码、推理代码、训练指标和日志。这种开放性使研究人员能够完全复现模型训练过程,理解模型的性能表现,并根据需要对模型进行微调。

  3. 评估工具的提供:项目包含了开发过程中使用的评估套件,以及500多个模型的检查点,每1000步训练过程中的每一个都有,还有评估代码,这些都属于Catwalk项目的一部分。这使得研究人员可以使用相同的工具来评估自己的模型或对OLMo模型进行进一步的分析。

模型参数和架构

OLMo提供了不同规模的模型变体,具体包括:

  • 1B(10亿参数)模型:具有16层,每层2048个隐藏单元,16个注意力头,训练了至少2万亿个令牌。
  • 7B(70亿参数)模型:包含32层,每层4086个隐藏单元,32个注意力头,训练了约2.46万亿个令牌。
  • 65B(650亿参数)模型:计划包含80层,每层8192个隐藏单元,64个注意力头(文章撰写时仍在训练中)。

这些模型采用了基于Vaswani等(2017年)的解码器仅Transformer架构,并进行了多项改进,例如:

  • 不使用偏置项,以提高训练稳定性。
  • 采用非参数层归一化。
  • 使用SwiGLU激活函数代替ReLU。
  • 引入旋转位置嵌入(RoPE)。
  • 使用修改版的BPE-based标记器,以减少个人可识别信息(PII)。

预训练数据:Dolma

OLMo使用的Dolma数据集是一个多源、多样性的3万亿令牌语料库,涵盖了从7种不同数据源获取的5亿文档。这个数据集旨在促进语言模型预训练的开放研究,并包括网络页面、代码、社交媒体、STEM论文、书籍和百科资料等内容。

性能评估

OLMo 7B在许多生成和阅读理解任务(如truthfulQA)上与Llama 2不相上下,但在流行的问答任务(如MMLU或Big-bench Hard)上略微落后。使用AI2的Paloma和可用检查点,分析了模型预测语言的能力与模型规模因素(如训练令牌数)之间的关系。Paloma试图通过平等地采样每个领域来更均衡地代表LLM使用的许多领域。

👉 野卡 | 一分钟注册,轻松订阅海外线上服务

项目地址

OLMo项目地址

(0)
上一篇 2025年8月27日
下一篇 2025年8月27日

相关推荐

  • 全球虚拟万事达Visa信用卡申请指南

    在这篇文章中,我们将为您提供关于如何申请全球虚拟万事达Visa信用卡的详细步骤和注意事项。无论您是想进行跨境支付,还是希望在海外购物,这张卡都能为您提供便利。 申请虚拟信用卡的优势…

    文章 2025年7月8日
  • 虚拟信用卡推荐:申请 Visa-Mastercard 虚拟卡的最佳选择

    众所周知,信用卡的面签不仅麻烦,而且门槛较高。加上新冠疫情的影响,许多人很难申请到双币信用卡。因此,不用面签的虚拟信用卡应运而生。它们审批快、发卡迅速、安全性高,且全程线上操作,成…

    文章 2025年2月13日
  • 如何申请 Claude API 并免费使用?详细指南

    Claude API 是由 Anthropic 公司开发的一款强大的人工智能聊天机器人 API,广泛应用于撰写文章、编写代码等多个场景。本文将为您详细介绍如何申请 Claude A…

    文章 2025年3月10日
  • Flux与Midjourney的对比:AI绘画工具的较量

    在当今数字化时代,AI绘画工具如雨后春笋般涌现,其中Flux和Midjourney备受关注。这两款工具都声称能够为用户提供高质量的绘画创作体验,但它们在多个方面存在着差异。 功能特…

    文章 2025年7月19日
  • 如何应对 Facebook 社群守则违规?5 种解封账号的方法

    当您的 Facebook 账号因违反社群守则而被封停时,不仅无法使用特定功能,还可能导致客户和订单的损失。毕竟,Facebook、Instagram 和 Threads 是许多商家…

    文章 2025年6月10日
  • Suno音乐创作新手指南(详细教程)

    Suno是全球音乐创作领域的领先工具,其地位与GPT、Midjourney和Sora等巨头相当。用户可以在电脑或手机上访问 www.suno.ai(国内可正常使用),点击“Make…

    2025年4月4日
  • 新手指南:没有信用卡该如何申请全球付虚拟信用卡?

    很多新手朋友在刚入行时常常会问到一个问题:如何在没有信用卡的情况下进行支付?因为国外的域名、虚拟主机、VPS或服务器等网络服务,大多数支付方式都要求使用信用卡或PayPal,而绝大…

    文章 2025年7月15日
  • 10分钟掌握Cursor的全部潜力:从基础操作到高级技巧

    Cursor是一款基于VS Code二次开发的AI编辑器,最近备受关注。与传统编辑器相比,Cursor将AI技术深度融合到各个功能点,带来了前所未有的用户体验。它不仅依托VS Co…

    文章 2025年5月3日
  • 野卡虚拟信用卡注册指南:简单易懂,快速上手

    想要轻松注册野卡虚拟信用卡?本文为您提供详细的图文教程,傻瓜式操作,分分钟搞定! 注册步骤 访问 野卡 官网 打开 野卡 官网。 点击注册按钮 在页面右上角点击【注册】按钮,或在首…

    文章 2025年5月7日
  • 如何关闭苹果自动续费及取消订阅服务

    关闭苹果自动续费的步骤 关闭苹果自动续费订阅的方法如下: 方法一:通过设置取消订阅 打开手机,点击 设置。 选择 iTunes Store 与 App Store。 点击顶部的 A…

    文章 2025年4月14日
  • Fomepay跑路后,如何高效开通Claude3,订阅MidJourney并升级ChatGPT至4.0的实用指南

    Fomepay跑路情况说明 最近,许多人发现Fomepay和Fomecard已经跑路,手机无法接收到验证码,虽然有些用户可以通过邮箱登录,但账户中的资金却无法提现(我在页面上还有几…

    2025年6月28日
  • Midjourney 促销码信息 [2025]

    目前没有可用的 Midjourney 促销码。 我们已经进行了全面检查。 Midjourney 仍处于测试阶段,从未为其付费订阅计划提供过促销码。 我们将继续关注 Midjourn…

    2025年8月14日
  • 手把手教你获取和使用 Claude API 密钥

    今天,我将与大家分享如何获取和使用 Claude API 密钥。作为一款强大的工具,Claude API 能够帮助我们更好地处理数据和进行分析,因此获取并正确使用 API 密钥至关…

    2025年2月19日
  • Suno AI 音乐生成器

    什么是 Suno AI 音乐生成器? Suno AI 音乐生成器是由位于马萨诸塞州剑桥的 Suno 公司开发的一款人工智能音乐创作工具。Suno 团队由音乐家和人工智能专家组成,其…

    文章 2025年6月18日
  • Claude 突然无法使用的原因及解决方法

    大家是否遇到过这样的情况:半小时前还在正常使用的 Claude APP,突然在 Slack 中消失了? 最近我正在忙于撰写文章,没有 Claude 的协助,工作效率大幅下降。于是,…

    2025年2月13日
  • ChatGPT 收费标准:全面解析与订阅指南

    对于希望获得更高效和强大功能的用户来说,了解 ChatGPT 收费标准 是至关重要的。ChatGPT 提供免费版本和收费版本(ChatGPT Plus),后者以月订阅制的形式提供更…

    文章 2025年4月4日
  • Cursor软件中文版设置指南

    在日常使用Cursor软件时,许多用户希望将其界面语言设置为中文,以便更好地理解和操作。本文将介绍两种将Cursor软件设置为中文版的方法,包括使用扩展程序和配置语言设置。 一、使…

    文章 2025年4月25日
  • 如何更改您的 Adobe 帐户国家-地区

    了解在您移居至其他国家/地区后,如何更改您的 Adobe 帐户的国家/地区设置。 在没有有效订阅的情况下更改国家/地区 如果您直接向 Adobe 购买 如果您没有有效的订阅,您可以…

    2025年5月16日
  • 代码神器 Cursor:究竟有多惊艳?

    在之前的讨论中,我提到过要介绍各种 agent 框架和 coding agent 的实现,但一直没能抽出时间。最近,我对 AI 辅助编程的产品进行了深入的探索,想和大家分享一下程序…

    2025年4月14日
  • 实用的虚拟信用卡(VCC)指南

    在访问各种网络平台时,您可能会遇到许多海外购物网站、APP或影视会员等需要使用国内信用卡却无法支付的情况。这种情况下,申请一张“外国虚拟信用卡”显得尤为重要。虚拟信用卡不仅可以解决…

    2025年7月17日