AMD 开源 “GAIA”:用于本地高效运行大模型


AMD宣布推出专为本地运行大语言模型(LLM)设计的开源应用GAIA(发音 /ˈɡaɪ.ə/),目前支持 Windows 平台。

GAIA 是一款生成式 AI 应用,可在 Windows PC 上实现本地化私密运行 LLM,并针对锐龙 AI 300 系列处理器进行了优化。该应用通过 NPU 提升 AI 任务性能,并支持混合部署量化 LLM。

GAIA 基于 ONNX TurnkeyML 的 Lemonade SDK 开发,采用检索增强生成(RAG)技术,支持 Llama、Phi 等主流模型。其四大功能模块包括 Chaty 聊天机器人、Clip 视频搜索专家、Joker 笑话生成器和 Simple Prompt 测试工具。

AMD 提供普通版和混合版安装方案,普通版兼容任意 Windows 设备,混合版专为锐龙 AI 300 系列优化。

GAIA 的本地化处理确保数据隐私,响应延迟降低至毫秒级,并支持离线运行。该项目采用 MIT 开源协议,未来或扩展至多平台支持。


相關推薦

2025-03-20

Ollama 是开源跨平台大模型工具,让运行 Llama 3、DeepSeek-R1、Gemma 3 以及其他大语言模型变得更容易,现已发布最新版本 0.6.2。 Ollama 是一个开源的本地大语言模型运行框架,简化了利用 llama.cpp 后端运行各种 LLM 以及与其他桌面

2025-07-22

AIbase 从网络信息获悉,京东正式开源了一款产品级端到端通用多智能体系统JoyAgent-JDGenie,在GAIA基准测试中以75.15%的准确率超越OWL、OpenManus等竞品,位居行业前列。 GAIA基准领跑,性能卓越 JoyAgent-JDGenie在GAIA基准测试中表现亮

2025-05-17

及修复模型卸载后进程持续运行的问题 Ollama 是一个开源的本地大语言模型运行框架,简化了利用 llama.cpp 后端运行各种 LLM 以及与其他桌面软件方便集成的过程,为普通用户提供简单易用的大语言模型(LLM)的本地部署和管

2023-10-26

InfoWorld 公布了 2023 年最佳开源软件榜单,旨在表彰年度领先的软件开发、数据管理、分析、人工智能和机器学习开源工具。 InfoWorld 是致力于引领 IT 决策者走在科技前沿的国际科技媒体品牌,每年 InfoWorld 都会根据软件对开源

2023-10-19

【源创会预告】1024 程序员节(的前两天),相约开源PHP办公室,我们一起聊 AI!>>> 英伟达发布了 Windows 版本的 TensorRT-LLM 库,称其将大模型在 RTX 上的运行速度提升 4 倍。 GeForce RTX 和 NVIDIA RTX GPU 配备了名为 Tensor Core 的专用

2024-08-24

sp; UOS AI 技术亮点 大语言模型 UOS AI 接入qwen2、llama2等开源大语言模型,提供聊天对话功能,通过提示词工程可做文档总结、翻译功能。模型由llama.cpp与OpenVINO推理。 自定义语言模型集成 UOS AI遵循OpenAI的模型通信协议,实现

2023-07-25

以及各行业领域的研究报告定制服务。 会议还邀请到了开源PHP的董事长马越就模型开源和AI行业应用进行了相关分享。开源PHP创立于 2008 年,收录全球知名开源项目近 10 万款,涉及几百个不同的分类,并于 2022 年发布了中国开

2023-10-21

【源创会预告】1024 程序员节(的前两天),相约开源PHP办公室,我们一起聊 AI!>>> (2023 年 10 月 19 日,北京)Alluxio 作为一家承载各类数据驱动型工作负载的数据平台公司,现推出全新的 Alluxio Enterprise AI 高性能数据平台, 旨

2024-01-16

b  ——  一个旨在解决大模型相关资产治理难题的开源项目。 CSGHub的使命是为用户提供一个开源开放的、针对大模型原生设计的资产管理平台,支持私有化部署和离线运行。我们的目标是为用户创造一个安全、高效且可

2025-07-30

界人工智能大会(WAIC 2025), 并在大会公开了 RWKV 最新的高效大模型架构:RWKV-7s,吸引了来自产业界、学术界及媒体的广泛关注与讨论。 战略合作 广泛落地 7月26日,移远通信宣布与RWKV公司建立全面合作关系,双方将依托移远

2024-07-12

0X的deepin镜像基于最新的deepin V23 RC2主线打造,采用了ESWIN开源的、针对EIC7700X优化的6.6内核,为用户提供最佳的性能和体验。经过deepin-ports SIG团队的全面测试,deepin V23在EIC7700X上运行稳定,网络连接、USB设备访问、HDMI视频输出

2023-03-31

AMD-Xilinx 最近开源了他们基于 LLVM 的 Nanotube 编译器。根据介绍,AMD-Xilinx Nanotube 编译器采用 eBPF XDP C 代码,并构建在 LLVM 编译器堆栈之上,然后能够在 HLS C++ 中生成一个可在 Xilinx FPGA 上运行的数据包处理管道。 Nanotube 是编译

2025-05-23

能模型制造商 Mistral 在因其最新闭源模型 Medium3受到部分开源社区批评后,迅速回归开源路线。该公司近日与开源初创公司 All Hands AI(OpenDevin 的创建者)合作,推出了全新的开源语言模型 Devstral。这款拥有2400万参数的轻量级模

2025-07-12

MiniCPM 端侧客户端已正式发布。 全面支持 Intel Core Ultra 系列处理器本地部署,低延迟、高效率、隐私更安全。 基于 OpenVINO 推理框架深度优化,推理速度至高可达每秒 80 tokens! 专为开发者、研究人员与 AI 爱好者打造的本