AMD 开源 “GAIA”：用于本地高效运行大模型

2025-03-26 發表於开源资讯

AMD宣布推出专为本地运行大语言模型（LLM）设计的开源应用GAIA（发音 /ˈɡaɪ.ə/），目前支持 Windows 平台。

GAIA 是一款生成式 AI 应用，可在 Windows PC 上实现本地化私密运行 LLM，并针对锐龙 AI 300 系列处理器进行了优化。该应用通过 NPU 提升 AI 任务性能，并支持混合部署量化 LLM。

GAIA 基于 ONNX TurnkeyML 的 Lemonade SDK 开发，采用检索增强生成（RAG）技术，支持 Llama、Phi 等主流模型。其四大功能模块包括 Chaty 聊天机器人、Clip 视频搜索专家、Joker 笑话生成器和 Simple Prompt 测试工具。

AMD 提供普通版和混合版安装方案，普通版兼容任意 Windows 设备，混合版专为锐龙 AI 300 系列优化。

GAIA 的本地化处理确保数据隐私，响应延迟降低至毫秒级，并支持离线运行。该项目采用 MIT 开源协议，未来或扩展至多平台支持。

相關推薦

京东开源轻量化通用多智能体 JoyAgent-JDGenie，GAIA 准确率 75.15%

2025-07-22

AIbase 从网络信息获悉，京东正式开源了一款产品级端到端通用多智能体系统JoyAgent-JDGenie，在GAIA基准测试中以75.15%的准确率超越OWL、OpenManus等竞品，位居行业前列。 GAIA基准领跑，性能卓越 JoyAgent-JDGenie在GAIA基准测试中表现亮

开源跨平台大模型工具 Ollama 0.6.2 发布，新增对 AMD Strix Halo 的支持

2025-03-20

Ollama 是开源跨平台大模型工具，让运行 Llama 3、DeepSeek-R1、Gemma 3 以及其他大语言模型变得更容易，现已发布最新版本 0.6.2。 Ollama 是一个开源的本地大语言模型运行框架，简化了利用 llama.cpp 后端运行各种 LLM 以及与其他桌面

Ollama 发布 v0.7.0，增强多模态能力并引入多项优化

2025-05-17

及修复模型卸载后进程持续运行的问题 Ollama 是一个开源的本地大语言模型运行框架，简化了利用 llama.cpp 后端运行各种 LLM 以及与其他桌面软件方便集成的过程，为普通用户提供简单易用的大语言模型（LLM）的本地部署和管

InfoWorld 公布 2023 年最佳开源软件

2023-10-26

InfoWorld 公布了 2023 年最佳开源软件榜单，旨在表彰年度领先的软件开发、数据管理、分析、人工智能和机器学习开源工具。 InfoWorld 是致力于引领 IT 决策者走在科技前沿的国际科技媒体品牌，每年 InfoWorld 都会根据软件对开源

英伟达发布 Windows 版 TensorRT-LLM 库，为本地运行大模型提速

2023-10-19

【源创会预告】1024 程序员节（的前两天），相约开源PHP办公室，我们一起聊 AI！>>> 英伟达发布了 Windows 版本的 TensorRT-LLM 库，称其将大模型在 RTX 上的运行速度提升 4 倍。 GeForce RTX 和 NVIDIA RTX GPU 配备了名为 Tensor Core 的专用

deepin 23丨大有智慧，UOS AI应用、功能全面解读

2024-08-24

sp; UOS AI 技术亮点大语言模型 UOS AI 接入qwen2、llama2等开源大语言模型，提供聊天对话功能，通过提示词工程可做文档总结、翻译功能。模型由llama.cpp与OpenVINO推理。自定义语言模型集成 UOS AI遵循OpenAI的模型通信协议，实现

“JIANG”大模型发布，参数1400亿，聚焦金融和商业垂直领域

2023-07-25

以及各行业领域的研究报告定制服务。会议还邀请到了开源PHP的董事长马越就模型开源和AI行业应用进行了相关分享。开源PHP创立于 2008 年，收录全球知名开源项目近 10 万款，涉及几百个不同的分类，并于 2022 年发布了中国开

Alluxio AI 全新产品发布：无缝对接低成本对象存储 AI 训练解决方案

2023-10-21

【源创会预告】1024 程序员节（的前两天），相约开源PHP办公室，我们一起聊 AI！>>> （2023 年 10 月 19 日，北京）Alluxio 作为一家承载各类数据驱动型工作负载的数据平台公司，现推出全新的 Alluxio Enterprise AI 高性能数据平台, 旨

全球首发｜原生开源大模型托管项目 CSGHub

2024-01-16

b —— 一个旨在解决大模型相关资产治理难题的开源项目。 CSGHub的使命是为用户提供一个开源开放的、针对大模型原生设计的资产管理平台，支持私有化部署和离线运行。我们的目标是为用户创造一个安全、高效且可

deepin V23 成功适配奕斯伟计算 EIC7700X，RISC-V 桌面生态发展再提速

2024-07-12

0X的deepin镜像基于最新的deepin V23 RC2主线打造，采用了ESWIN开源的、针对EIC7700X优化的6.6内核，为用户提供最佳的性能和体验。经过deepin-ports SIG团队的全面测试，deepin V23在EIC7700X上运行稳定，网络连接、USB设备访问、HDMI视频输出

全新高效模型架构！RWKV-7s 闪耀 WAIC

2025-07-30

界人工智能大会（WAIC 2025）, 并在大会公开了 RWKV 最新的高效大模型架构：RWKV-7s，吸引了来自产业界、学术界及媒体的广泛关注与讨论。战略合作广泛落地 7月26日，移远通信宣布与RWKV公司建立全面合作关系，双方将依托移远

AMD-Xilinx 开源基于 LLVM 的 Nanotube 编译器

2023-03-31

AMD-Xilinx 最近开源了他们基于 LLVM 的 Nanotube 编译器。根据介绍，AMD-Xilinx Nanotube 编译器采用 eBPF XDP C 代码，并构建在 LLVM 编译器堆栈之上，然后能够在 HLS C++ 中生成一个可在 Xilinx FPGA 上运行的数据包处理管道。 Nanotube 是编译

Mistral 重返开源阵营：发布超高效代码 AI 模型 Devstral

2025-05-23

能模型制造商 Mistral 在因其最新闭源模型 Medium3受到部分开源社区批评后，迅速回归开源路线。该公司近日与开源初创公司 All Hands AI（OpenDevin 的创建者）合作，推出了全新的开源语言模型 Devstral。这款拥有2400万参数的轻量级模

MiniCPM 端侧客户端正式发布并开源

2025-07-12

MiniCPM 端侧客户端已正式发布。全面支持 Intel Core Ultra 系列处理器本地部署，低延迟、高效率、隐私更安全。基于 OpenVINO 推理框架深度优化，推理速度至高可达每秒 80 tokens！专为开发者、研究人员与 AI 爱好者打造的本

熱門推薦