AMD 开源首款小语言模型 AMD-135M

2024-09-30 發表於开源资讯

AMD 宣布推出 AMD-135M —— Llama 家族的第一个小型语言模型。该模型具有推测解码功能，其训练代码、数据集和权重都是开源的，以便开发人员可以重现该模型并帮助训练其他 SLM 和 LLM。

“大语言模型通常使用自回归方法进行推理。然而，这种方法的一个主要限制是每次前向传递只能生成单个 token，导致内存访问效率低下并影响整体推理速度。

推测解码的出现解决了这个问题。其基本原理是使用小型草稿模型生成一组候选 token，然后由更大的目标模型进行验证。这种方法允许每次前向传递生成多个 token，而不会影响性能，从而显著减少内存访问消耗，并实现几个数量级的速度提升。”

公告称，AMD-135M 使用 AMD Instinct MI250 加速器从头开始训练，拥有 6700 亿个 token，包括 AMD-Llama-135M 和 AMD-Llama-135M-code 两个型号。

预训练：使用四个 MI250 节点，在六天内用 6700 亿个通用数据 token 从头开始训练 AMD-Llama-135M 模型。
代码微调：AMD-Llama-135M 代码变体利用另外 200 亿个代码数据 token 进行了微调，在同一硬件上耗时四天。

更多详情可查看官方公告。

下载地址：https://huggingface.co/amd/AMD-Llama-135m

相關推薦

六款新发布的 Linux 笔记本电脑：迷你、4K 显示屏、超极本……

2022-07-12

，包括 Ubuntu 22.04 LTS。 MNT Pocket Reform MNT 是德国一家开发开源硬件和软件的公司，该公司认为未来的数字生活是可持续并且开源的，并且此前曾发布了一台 999 美元起售的 MNT Reform 的笔记本电脑。现在 MNT 又将推出一台名为 Pocket

OpenAI 正在打造其首款自研芯片

2024-11-01

正在与博通（Broadcom）及台积电（TSMC）合作，设计并制造首款用于支持其人工智能系统的自研芯片，OpenAI 希望借此减少对单一芯片供应商的依赖，分散其芯片供应，并满足 AI 模型对高计算需求的支持。 OpenAI 的原计划是与台

Racket v8.6 发布，Lisp 语言分支

2022-08-18

程 (Language Oriented Programming, LOP) 的思想，它被实现为一种小语言。此实现只有一个 C 文件（加上用 Zuo 实现的库），所以它很容易编译。zuo/build 库是以 make 和 Shake 为模型的，用于跟踪依赖关系和构建步骤支持模板向量 (stencil ve

朱雀仿宋 —— 首款开源仿宋字体

2023-08-24

「朱雀仿宋」是刚刚开源的仿宋字体，其灵感来自民国时期的仿宋活字“南宋”，并以此作为蓝本。字体效果预览：以下内容来自官方介绍：「朱雀仿宋」是璇玑造字的开源仿宋字体计划，志在最终提供高质量的、

AigcPanel v0.14.0 发布，开源 AI 数字人系统

2025-07-12

AigcPanel v0.14.0 已经发布，开源 AI 数字人系统。此版本更新内容包括：新增：直播视频内容增加开关，默认关闭新增：直播用户重复进入重复忽略可设置新增：GPT-SoVITS模型一键运行包新增：CosyVoice-300M模型（优化版）

全国首款支持多环境开发的 IDE —— CEC-IDE

2023-08-25

使命，自主研发，提供多种主流语言的开发环境，是国内首款同时支持麒麟、统信、Windows、Mac OS 等多环境的 IDE 工具。 CEC-IDE 提供了代码编写、智能辅助、编译调试、版本控制等功能，同时自建插件市场，除了提供 1600 余种技

AigcPanel v0.14.0 直播功能优化更新，一大波模型更新升级

2025-07-17

持智能直播、视频合成、声音合成、声音克隆，简化本地模型管理、一键导入和使用AI模型。禁止使用本产品进行违法违规业务，使用本软件请遵守中华人民共和国法律法规。重磅更新！直播视频内容增加开关，默认关

TickIt：基于 LLM 的自动化 Oncall 升级

2025-06-12

在进一步的 Oncall 升级性能评估方面，我们还对比了基于小语言模型（SLM）和大语言模型（LLM）的多种方法。小语言模型受限于参数规模，其语言理解能力相较 LLM 有较大差距，且部分非端到端的方法设计在信息传递过程中易出

Coreboot 4.19 发布，替代 BIOS 和 UEFI 的开源项目

2023-01-31

Coreboot 原名 LinuxBIOS，是一个旨在取代计算机中专有固件（BIOS 或 UEFI）的软件项目，它采用轻量级固件设计，只执行加载和运行现代 32 位或 64 位操作系统所需的最少量任务。由于 coreboot 要初始化硬件，所以必须为所要支持的每

华为与西工大合作，发布首款流体力学大模型“秦岭・翱翔”

2023-11-10

流体力学智能化国际联合研究所携手华为 AI4Sci Lab 在国产开源流体计算软件风雷的基础上，依托昇腾 AI 澎湃算力及昇思 MindSpore AI 框架共同研发的面向飞行器流体仿真的智能化模型。大模型通过打造智能通用的流体力学软件平

从 Coreboot 中删除旧 AMD CPU 和主板支持，代码减少约 738k 行

2022-11-09

Upstream Coreboot 已逐步停止支持较旧的 AMD 14h / 15h / 16h 系列处理器和相关主板。如 Phoronix 所述，由于这些较旧的 AMD 平台依赖于旧的 SMP 初始化路径，并且从未移植到较新的代码，因此在弃用之后，这些 targets 已从上游 Cor

挑战 ChatGPT，国产有这 8 款 AI 大模型产品

2023-09-08

大语言模型。百川智能称，截止今日，Baichuan-7B/13B 两款开源模型在 Huggingface 下载量已突破三百万。 Baichuan-53B 在线体验：https://www.baichuan-ai.com/home 商汤（日日新大模型）商汤大模型应用 “商量 SenseChat” 也于 8 月 31 日宣

禅道 18.8 发布啦，内置海量度量项，支持百度文心一言，DevOps平台优化！

2023-10-24

提升至量化管理。同时，AI提词支持百度文心一言大语言模型；DevOps安装时支持一键安装多个相关应用、支持使用命令行进行版本升级，大幅提升安装和升级效率。新增功能点度量项： BI二级菜单新增度量项模块。

Mozilla 发布首款大模型 Fakespot Chat

2023-11-12

欺骗性产品评论的初创公司 Fakespot。现在它推出了自己的首款大模型 Fakespot Chat。地址：https://www.fakespot.com/activate-fakespot-chat 根据介绍，Fakespot Chat 会在消费者在线购物时为其提供帮助，评估商品，回答有关产品的问题，甚至

熱門推薦