京东开源轻量化通用多智能体 JoyAgent-JDGenie,GAIA 准确率 75.15%


AIbase 从网络信息获悉,京东正式开源了一款产品级端到端通用多智能体系统JoyAgent-JDGenie,在GAIA基准测试中以75.15%的准确率超越OWL、OpenManus等竞品,位居行业前列。

GAIA基准领跑,性能卓越

JoyAgent-JDGenie在GAIA基准测试中表现亮眼,以75.15%的总体准确率刷新了多智能体系统的性能纪录。

根据GAIA基准的评估标准,该系统在难度分级的任务中展现了优异的能力:Level1任务准确率达85%以上,Level2任务接近78%,而在最复杂的Level3任务中也取得了55%的出色成绩,显著超越其他开源框架如OWL(约65%)和OpenManus(约65%)。

端到端多智能体框架,开箱即用

JoyAgent-JDGenie是一款完整的端到端多智能体系统,支持用户通过简单查询或任务输入直接获得答案或解决方案。该框架集成了前端、后端、核心引擎以及多个子智能体模块,包括报告生成智能体、代码智能体、PPT智能体和文件智能体,覆盖了从文档处理到代码生成、演示文稿制作等多样化场景。AIbase了解到,开发者可通过挂载自定义子智能体或外部工具(如Web搜索API或Python解释器)进一步扩展功能,满足特定业务需求。

与传统单一智能体系统不同,JoyAgent-JDGenie采用多层级协作设计,通过任务分解和智能体协同,高效处理复杂任务。例如,用户输入“生成一份关于2025年AI趋势的PPT”,系统会自动分配任务给PPT智能体和数据分析智能体,生成包含图表和内容的演示文稿。这种开箱即用的特性极大降低了开发门槛,适合企业快速部署AI应用。

多模态与记忆优化,智能更进一步

JoyAgent-JDGenie的多模态与记忆设计是其核心亮点。系统支持文本、图像、代码等多种输入和输出形式,能够处理GAIA基准中的多模态任务,如解析PDF文件、分析图像内容或处理音频数据。此外,框架引入了跨任务级别的相似任务记忆机制,允许系统根据历史任务记录优化当前任务的处理效率。例如,在重复生成类似报告时,系统可调用历史数据,减少重复计算,提升响应速度。

AIbase从社区反馈中获悉,JoyAgent-JDGenie的多模态能力在处理复杂任务时表现出色。例如,在GAIA Level3任务中,系统能够通过链式推理(Chain-of-Thought)结合外部工具,准确回答涉及多源数据整合的问题,如“根据某幅画作和历史记录提取特定信息”。这种能力使其在数据分析、内容创作和自动化工作流中具有广泛应用前景。

开源生态,助力开发者创新

目前,JoyAgent-JDGenie 已公开了前端、后端、框架、引擎以及核心子智能体的完整代码,开发者可基于此进行二次开发或直接部署。项目还提供了详细的文档和快速入门指南,支持在Windows、Linux等多个平台上运行,兼容主流硬件环境。

社区反馈显示,JoyAgent-JDGenie的模块化设计便于扩展。例如,开发者可通过添加新的子智能体(如专用于金融分析或医疗数据处理的智能体)快速定制系统。此外,京东团队表示将持续优化框架,计划引入本地化LLM支持和更高效的推理加速技术,以降低对云端API的依赖,进一步提升性能和成本效益。


相關推薦

2025-07-15

智源研究院宣布开源具身大脑RoboBrain 2.0 32B版本以及跨本体大小脑协同框架 RoboOS 2.0单机版。 RoboBrain 2.0,作为集感知、推理与规划于一体面向真实物理环境的“通用具身大脑”,32B版本凭借时空认知能力的突破,在多项权威具

2025-06-17

ing 信息兼容 OpenTelemetry,因此理论上可接入市面上主流的开源平台如 Langfuse,或者阿里云 ARMS。 从聊天机器人、工作流到多智能体 聊天机器人(ChatBot) AI 应用开发不只是无状态大模型的 API 调用过程,由于大模型预训练的特

2025-06-21

发者大会HDC 2025期间,华为宣布仓颉编程语言将于7月30日开源。 2024 年 6 月,华为终端 BG 软件部总裁龚体宣布,下一代编程语言仓颉今日起正式开启预览。官网介绍显示,仓颉编程语言是一款面向全场景智能的新一代编程语言

2025-03-26

AMD宣布推出专为本地运行大语言模型(LLM)设计的开源应用GAIA(发音 /ˈɡaɪ.ə/),目前支持 Windows 平台。 GAIA 是一款生成式 AI 应用,可在 Windows PC 上实现本地化私密运行 LLM,并针对锐龙 AI 300 系列处理器进行了优化。该应用

2025-06-07

本体的任务规划。 实验数据显示,RoboBrain 2.0的任务规划准确率相较RoboBrain 1.0实现了74%的效果提升。 在空间智能方面,RoboBrain 2.0在原有可操作区域(Affordance)感知与操作轨迹(Trajectory)生成能力的基础上,实现了17%的性能提

2025-05-27

安全领域的正向赋能。 开放生态:拥抱智能体互联网与开源协作 在技术架构上,微软全面拥抱开放协议,加入 MCP 指导委员会,并在 GitHub、Copilot Studio 等平台支持 MCP 与 A2A 协议,推动智能体间互操作。李冕在专访中表示,AI

2024-07-06

在2024世界人工智能大会(WAIC 2024)期间,开源通用人形机器人公版机“青龙”正式发布。“青龙”人形机器人身高185cm,体重80kg,拥有高度仿生的躯干构型和拟人化的运动控制,支持多模态机动、多模态感知、多模态交互和多

2025-06-17

手引导功能。 提问:如何平衡 AI 集成与传统 SSH 的 “轻量化”? 覃奕:我们采用「双模式并行架构」:保留纯命令行操作逻辑,确保老用户轻量使用;AI 作为辅助模式,内存占用控制在 50MB 以内。其实智能化与轻量化并不矛

2024-08-27

,国内已有180家公司正式推出了自己的AI大模型服务。在开源社区中,用户可部署使用的大模型更是多如繁星,数不胜数。 这些模型按照功能可以分为通用语言处理、语音处理、图像处理以及向量化处理等多个类别,琳琅满目

2024-06-27

像处理方向积累的丰富研发经验,通过对两个广泛使用的开源代码库zxing的条码识别算法和glide的图像加载与缓存机制进行深入分析,完成了适用于仓颉语言的高性能图像处理算法的研究、开发和优化,并成功实现了QRcode4cj(zxing

2024-07-12

分组管理,便于权限统一设置。 三、技术架构 本开源运维平台项目基于 Python 语言开发,主要采用 Django 和 Django REST Framework(DRF)进行开发和维护。为了确保项目结构的清晰和模块化,采用了一种分层设计思想,将不同的

2025-06-05

基础上。不同于传统 AI 仅专注于单一任务,Manus 采用向量化处理方式,通过跨应用调用工具来实现从用户指令到最终成果的完整流程。 当用户需要生成视频时,系统并非直接生成,而是智能调度各类资源,整合多种技术手段,

2024-06-22

速度,是应用开发中必不可少的能力。仓颉语言实现了轻量化用户态线程和并发对象库,让高效并发变得轻松。 仓颉语言采用用户态线程模型,每个仓颉线程都是极其轻量级的执行实体,拥有独立的执行上下文但共享内存。对

2023-11-09

景中,为了探索 SOPs 对多智能体协作的效果,我们选择了开源工作中支持软件开发任务的智能体框架 ChatDev 作为实验比较对象。ChatDev 是基于 ChatChain 和软件开发瀑布流的角色分工进行智能体组织和协作的框架。我们从 SoftwareDev