京东开源轻量化通用多智能体 JoyAgent-JDGenie,GAIA 准确率 75.15%


AIbase 从网络信息获悉,京东正式开源了一款产品级端到端通用多智能体系统JoyAgent-JDGenie,在GAIA基准测试中以75.15%的准确率超越OWL、OpenManus等竞品,位居行业前列。

GAIA基准领跑,性能卓越

JoyAgent-JDGenie在GAIA基准测试中表现亮眼,以75.15%的总体准确率刷新了多智能体系统的性能纪录。

根据GAIA基准的评估标准,该系统在难度分级的任务中展现了优异的能力:Level1任务准确率达85%以上,Level2任务接近78%,而在最复杂的Level3任务中也取得了55%的出色成绩,显著超越其他开源框架如OWL(约65%)和OpenManus(约65%)。

端到端多智能体框架,开箱即用

JoyAgent-JDGenie是一款完整的端到端多智能体系统,支持用户通过简单查询或任务输入直接获得答案或解决方案。该框架集成了前端、后端、核心引擎以及多个子智能体模块,包括报告生成智能体、代码智能体、PPT智能体和文件智能体,覆盖了从文档处理到代码生成、演示文稿制作等多样化场景。AIbase了解到,开发者可通过挂载自定义子智能体或外部工具(如Web搜索API或Python解释器)进一步扩展功能,满足特定业务需求。

与传统单一智能体系统不同,JoyAgent-JDGenie采用多层级协作设计,通过任务分解和智能体协同,高效处理复杂任务。例如,用户输入“生成一份关于2025年AI趋势的PPT”,系统会自动分配任务给PPT智能体和数据分析智能体,生成包含图表和内容的演示文稿。这种开箱即用的特性极大降低了开发门槛,适合企业快速部署AI应用。

多模态与记忆优化,智能更进一步

JoyAgent-JDGenie的多模态与记忆设计是其核心亮点。系统支持文本、图像、代码等多种输入和输出形式,能够处理GAIA基准中的多模态任务,如解析PDF文件、分析图像内容或处理音频数据。此外,框架引入了跨任务级别的相似任务记忆机制,允许系统根据历史任务记录优化当前任务的处理效率。例如,在重复生成类似报告时,系统可调用历史数据,减少重复计算,提升响应速度。

AIbase从社区反馈中获悉,JoyAgent-JDGenie的多模态能力在处理复杂任务时表现出色。例如,在GAIA Level3任务中,系统能够通过链式推理(Chain-of-Thought)结合外部工具,准确回答涉及多源数据整合的问题,如“根据某幅画作和历史记录提取特定信息”。这种能力使其在数据分析、内容创作和自动化工作流中具有广泛应用前景。

开源生态,助力开发者创新

目前,JoyAgent-JDGenie 已公开了前端、后端、框架、引擎以及核心子智能体的完整代码,开发者可基于此进行二次开发或直接部署。项目还提供了详细的文档和快速入门指南,支持在Windows、Linux等多个平台上运行,兼容主流硬件环境。

社区反馈显示,JoyAgent-JDGenie的模块化设计便于扩展。例如,开发者可通过添加新的子智能体(如专用于金融分析或医疗数据处理的智能体)快速定制系统。此外,京东团队表示将持续优化框架,计划引入本地化LLM支持和更高效的推理加速技术,以降低对云端API的依赖,进一步提升性能和成本效益。


相關推薦

2025-08-05

大模型,双方团队只经过短短一个多月的协作,就将模型准确率提升到了90.2%。 “通过正高职称考试,意味着该模型已具备主任级医师的专业判断力。”壹生检康创始人王强宇表示,大模型的核心价值在于,为女性用户提供居

2025-07-15

智源研究院宣布开源具身大脑RoboBrain 2.0 32B版本以及跨本体大小脑协同框架 RoboOS 2.0单机版。 RoboBrain 2.0,作为集感知、推理与规划于一体面向真实物理环境的“通用具身大脑”,32B版本凭借时空认知能力的突破,在多项权威具

2025-06-17

ing 信息兼容 OpenTelemetry,因此理论上可接入市面上主流的开源平台如 Langfuse,或者阿里云 ARMS。 从聊天机器人、工作流到多智能体 聊天机器人(ChatBot) AI 应用开发不只是无状态大模型的 API 调用过程,由于大模型预训练的特

2025-06-21

发者大会HDC 2025期间,华为宣布仓颉编程语言将于7月30日开源。 2024 年 6 月,华为终端 BG 软件部总裁龚体宣布,下一代编程语言仓颉今日起正式开启预览。官网介绍显示,仓颉编程语言是一款面向全场景智能的新一代编程语言

2025-03-26

AMD宣布推出专为本地运行大语言模型(LLM)设计的开源应用GAIA(发音 /ˈɡaɪ.ə/),目前支持 Windows 平台。 GAIA 是一款生成式 AI 应用,可在 Windows PC 上实现本地化私密运行 LLM,并针对锐龙 AI 300 系列处理器进行了优化。该应用

2025-08-08

破,催生“群体智能”新范式。 八、智能体价值评估:量化导向的“决策准绳” 智能体价值评估需衡量智能体的应用价值、经济价值和社会价值等多个方面,涵盖功能丰富度、性能优越度、用户满意度、业务影响、成本投入

2025-06-07

本体的任务规划。 实验数据显示,RoboBrain 2.0的任务规划准确率相较RoboBrain 1.0实现了74%的效果提升。 在空间智能方面,RoboBrain 2.0在原有可操作区域(Affordance)感知与操作轨迹(Trajectory)生成能力的基础上,实现了17%的性能提

2025-05-27

安全领域的正向赋能。 开放生态:拥抱智能体互联网与开源协作 在技术架构上,微软全面拥抱开放协议,加入 MCP 指导委员会,并在 GitHub、Copilot Studio 等平台支持 MCP 与 A2A 协议,推动智能体间互操作。李冕在专访中表示,AI

2024-07-06

在2024世界人工智能大会(WAIC 2024)期间,开源通用人形机器人公版机“青龙”正式发布。“青龙”人形机器人身高185cm,体重80kg,拥有高度仿生的躯干构型和拟人化的运动控制,支持多模态机动、多模态感知、多模态交互和多

2025-06-17

手引导功能。 提问:如何平衡 AI 集成与传统 SSH 的 “轻量化”? 覃奕:我们采用「双模式并行架构」:保留纯命令行操作逻辑,确保老用户轻量使用;AI 作为辅助模式,内存占用控制在 50MB 以内。其实智能化与轻量化并不矛

2024-08-27

,国内已有180家公司正式推出了自己的AI大模型服务。在开源社区中,用户可部署使用的大模型更是多如繁星,数不胜数。 这些模型按照功能可以分为通用语言处理、语音处理、图像处理以及向量化处理等多个类别,琳琅满目

2024-06-27

像处理方向积累的丰富研发经验,通过对两个广泛使用的开源代码库zxing的条码识别算法和glide的图像加载与缓存机制进行深入分析,完成了适用于仓颉语言的高性能图像处理算法的研究、开发和优化,并成功实现了QRcode4cj(zxing

2024-07-12

分组管理,便于权限统一设置。 三、技术架构 本开源运维平台项目基于 Python 语言开发,主要采用 Django 和 Django REST Framework(DRF)进行开发和维护。为了确保项目结构的清晰和模块化,采用了一种分层设计思想,将不同的

2025-06-05

基础上。不同于传统 AI 仅专注于单一任务,Manus 采用向量化处理方式,通过跨应用调用工具来实现从用户指令到最终成果的完整流程。 当用户需要生成视频时,系统并非直接生成,而是智能调度各类资源,整合多种技术手段,