京东开源轻量化通用多智能体 JoyAgent-JDGenie，GAIA 准确率 75.15%

2025-07-22 發表於开源资讯

AIbase 从网络信息获悉，京东正式开源了一款产品级端到端通用多智能体系统JoyAgent-JDGenie，在GAIA基准测试中以75.15%的准确率超越OWL、OpenManus等竞品，位居行业前列。

GAIA基准领跑，性能卓越

JoyAgent-JDGenie在GAIA基准测试中表现亮眼，以75.15%的总体准确率刷新了多智能体系统的性能纪录。

根据GAIA基准的评估标准，该系统在难度分级的任务中展现了优异的能力：Level1任务准确率达85%以上，Level2任务接近78%，而在最复杂的Level3任务中也取得了55%的出色成绩，显著超越其他开源框架如OWL（约65%）和OpenManus(约65%)。

端到端多智能体框架，开箱即用

JoyAgent-JDGenie是一款完整的端到端多智能体系统，支持用户通过简单查询或任务输入直接获得答案或解决方案。该框架集成了前端、后端、核心引擎以及多个子智能体模块，包括报告生成智能体、代码智能体、PPT智能体和文件智能体，覆盖了从文档处理到代码生成、演示文稿制作等多样化场景。AIbase了解到，开发者可通过挂载自定义子智能体或外部工具（如Web搜索API或Python解释器）进一步扩展功能，满足特定业务需求。

与传统单一智能体系统不同，JoyAgent-JDGenie采用多层级协作设计，通过任务分解和智能体协同，高效处理复杂任务。例如，用户输入“生成一份关于2025年AI趋势的PPT”，系统会自动分配任务给PPT智能体和数据分析智能体，生成包含图表和内容的演示文稿。这种开箱即用的特性极大降低了开发门槛，适合企业快速部署AI应用。

多模态与记忆优化，智能更进一步

JoyAgent-JDGenie的多模态与记忆设计是其核心亮点。系统支持文本、图像、代码等多种输入和输出形式，能够处理GAIA基准中的多模态任务，如解析PDF文件、分析图像内容或处理音频数据。此外，框架引入了跨任务级别的相似任务记忆机制，允许系统根据历史任务记录优化当前任务的处理效率。例如，在重复生成类似报告时，系统可调用历史数据，减少重复计算，提升响应速度。

AIbase从社区反馈中获悉，JoyAgent-JDGenie的多模态能力在处理复杂任务时表现出色。例如，在GAIA Level3任务中，系统能够通过链式推理（Chain-of-Thought）结合外部工具，准确回答涉及多源数据整合的问题，如“根据某幅画作和历史记录提取特定信息”。这种能力使其在数据分析、内容创作和自动化工作流中具有广泛应用前景。

开源生态，助力开发者创新

目前，JoyAgent-JDGenie 已公开了前端、后端、框架、引擎以及核心子智能体的完整代码，开发者可基于此进行二次开发或直接部署。项目还提供了详细的文档和快速入门指南，支持在Windows、Linux等多个平台上运行，兼容主流硬件环境。

社区反馈显示，JoyAgent-JDGenie的模块化设计便于扩展。例如，开发者可通过添加新的子智能体（如专用于金融分析或医疗数据处理的智能体）快速定制系统。此外，京东团队表示将持续优化框架，计划引入本地化LLM支持和更高效的推理加速技术，以降低对云端API的依赖，进一步提升性能和成本效益。

京东开源轻量化通用多智能体 JoyAgent-JDGenie，GAIA 准确率 75.15%

相關推薦

应用多点开花，AI 大模型从“炫技”走向“实干”

智源全面开源 RoboBrain 2.0 与 RoboOS 2.0

Spring AI Alibaba 1.0 GA 正式发布，Java 智能体开发进入新时代

华为自研仓颉编程语言将于 7 月 30 日开源

AMD 开源 “GAIA”：用于本地高效运行大模型

中国信通院发布“2025 智能体十大关键词”

智源发布 RoboOS 2.0，支持 MCP 机制

中国首个全尺寸开源通用人形机器人公版机“青龙”发布

微软构建开放智能体网络，以 AI 智能体重塑企业竞争力

从 “智” 到 “慧” 的运维进化：Wisdom SSH 的底层哲学与实践

斗罢艰险又出发 —— deepin 操作系统大模型取经之路

weops-lite v1.0 正式发布，轻量化运维平台

首批基于仓颉编程语言的高性能图像处理算法库发布

通用型 AI 智能体 Manus 新增“文字生成视频”功能