昆仑万维开源 Skywork-R1V 3.0


昆仑万维宣布发布并开源Skywork-R1V 3.0版本。其在后训练阶段通过强化学习策略深度激发模型的跨模态推理能力,在复杂逻辑建模与跨学科泛化方面实现双重飞跃。

公告介绍称,Skywork-R1V 3.0是昆仑万维多模态模型体系的关键节点与核心基石,成功将深度推理能力泛化到不同学科领域,表现出卓越的跨领域推理能力。它不仅能够胜任数学、物理等传统理工科推理任务,在地理、历史、人文、医学、艺术、商业、工程等领域同样表现不俗。

在权威的综合性多模态评测 MMMU 中,Skywork-R1V 3.0取得了 76.0 的开源模型最高成绩,并且在2025年高考数学新一卷上,R1V 3.0更是取得了142分的突出成绩。R1V 3.0的高考数学突出成绩,接近多款顶尖闭源模型,达到了开源多模态推理模型的最优结果。

R1V 3.0 MMMU达到了76的高分,超越了 Claude-3.7-Sonnet (75.0)和GPT-4.5(74.4)等闭源模型,逼近人类初级专家水平(76.2),Skywork-R1V 3.0在其他重要多学科测评基准上同样表现亮眼。

在更考验视觉推理的 EMMA-Mini(CoT) 上,以开源领先的 40.3 分超过更大尺寸的 Qwen2.5-VL-72B-Instruct和InternVL3-78B等模型,并缩小了与闭源模型 Claude-3.7-Sonnet的差距。

在覆盖中小学知识点的 MMK12 上,R1V 3.0 以 78.5 分再度领跑开源阵营,超越Qwen2.5-VL-72B-Instruct、InternVL3-78B等开源模型以及 GPT-4.5和 GPT-4o等闭源模型。

较上一代模型而言,Skywork-R1V 3.0在物理、逻辑等多个关键领域取得了显著性能提升,成为当前开源领域最强劲的多模态推理模型之一:

  • 物理推理: 在物理领域的权威评测 PhyX-MC-Text-Minimal 和 SeePhys 中,Skywork-R1V 3.0分别取得 52.8 分和 31.5 分的开源最优成绩。模型不仅能够精准理解力学、电磁学等基础物理概念,还擅长处理图文结合的复杂物理问题(例如解析受力分析图、电路示意图等专业图表),其物理推理水平已显著超过当前主流开源模型以及GPT-4.5和Gemini 2 Flash等部分闭源模型。

  • 逻辑推理:Skywork-R1V 3.0 在 LogicVista 测试中取得 59.7 分,在 VisuLogic 测试中取得 28.5 分。在 MME-Reasoning 中,Skywork-R1V 3.0更是获得 42.8 分的佳绩,超越了闭源模型Claude-4-Sonnet。

  • 数学推理:在权威数学评测基准MathVista、MathVerse和MathVision上,R1V 3.0分别取得了77.1分、59.6分和52.6分的优异成绩,领先于Qwen2.5-VL-72B-Instruct、InternVL3-78B、QVQ-72B-Preview等开源模型。

相關推薦

2025-04-25

继开源 Skywork-R1V 后,昆仑万维宣布再开源多模态推理模型的全新升级版本 —— Skywork-R1V 2.0(简称 R1V 2.0) 。 公告称,Skywork-R1V 2.0 是当前最均衡兼顾视觉与文本推理能力的开源多模态模型,该多模态模型在高考理科难题的深度

2023-11-06

2023年11月3日,昆仑万维“天工”大模型宣布通过《生成式人工智能服务管理暂行办法》备案,面向全社会开放服务! 用户在应用商店下载“天工APP”或登陆“天工官网”(www.tiangong.cn)均可直接注册使用。 官方介绍称,「天

2025-07-05

昆仑万维宣布继续开源第二代奖励模型(Reward Model)Skywork-Reward-V2系列,共包含8个基于不同基座模型和不同大小的奖励模型,参数规模从6亿到80亿不等,其在七大主流奖励模型评测榜单中全面夺魁。在2024年9月,昆仑万维曾首次

2023-10-31

昆仑万维宣布开源百亿级大语言模型「天工」Skywork-13B系列,并配套开源了600GB、150B Tokens的超大高质量开源中文数据集。昆仑万维「天工」Skywork-13B系列目前包括130亿参数的两大模型:Skywork-13B-Base模型、Skywork-13B-Math模型。 除模

2023-10-28

昆仑万维发布了2023年第三季度报告。据报告披露,昆仑万维第三季度全面加速推进“All in” AGI与AIGC的战略布局,在多个方向均取得了突破性进展。截至本报告期末,昆仑万维实现营业收入36.8亿元,同比增长8%。实现经营性现金

2023-12-02

12月1日,昆仑万维正式发布「天工SkyAgents」平台,助力大模型走入千家万户。「天工SkyAgents」是国内领先的AI Agents开发平台,基于昆仑万维「天工大模型」打造,具备从感知到决策,从决策到执行的自主学习和独立思考能力。用

2023-09-07

昆仑万维天工大模型在腾讯优图实验室联合厦门大学开展的多模态大语言模型(Multimodal Large Language Model,简称“MLLM”)测评中,综合得分排名第一。公告称,“这标志着昆仑万维天工大模型在多模态方面跻身世界领先水平,未

2025-05-22

昆仑万维最近于海外上线了通用 Agent 产品 Skywork.ai,包含多个专家 Agent 模式和通用模式。 Skywork AI 目前正在进行测试,用户可以直接注册,并且在测试期间完成任务不消耗积分。Skywork AI 旨在通过 AI 驱动的工具提升生产力。

2024-08-20

昆仑万维发布全球首个集成视频大模型与3D大模型的AI短剧平台SkyReels。集剧本生成、角色定制、分镜、剧情、对白/BGM及影片合成于一体,旨在让创作者“一键成剧”,轻松制作高质量AI视频。 SkyReels平台集成了昆仑万维自研剧

2024-10-31

10月29日,昆仑万维发布了2024年第三季度报告。截至本报告期末,公司实现营业收入38.3亿元,同比增长4%。今年前三季度,公司海外业务收入占比进一步提升至89.7%,同比增加5.6个百分点;整体毛利率达76.9%,继续保持在较高水平

2025-03-27

昆仑万维宣布推出 Mureka O1 模型与 Mureka V6 模型。“Mureka O1作为全球首款音乐推理大模型,性能超越Suno、模型登顶SOTA,中国科技创新再次在AI音乐领域领跑全球。” 2024年4月,昆仑万维发布了第一代音乐生成模型:Mureka V1(SkyMus

2024-08-14

成员!近日,豆包、通义、360AI搜索、360智脑、360智绘、昆仑万维天工AI、澜舟智库等重磅AI产品登陆麒麟软件商店人工智能专区,涵盖了AI对话、AI写作、AI绘图、AI搜索等多个领域,为用户带来更加丰富、智能的应用体验。 阿

2025-05-09

云、上海人工智能实验室、华为、出门问问、金山办公、昆仑万维、面壁智能、奇虎科技、美团、稀宇科技、月之暗面、紫东太初、中科闻歌、科大讯飞等多个机构共同贡献。 智源研究院于2023年11月首次发布中文互联网语料库C

2025-05-23

文心大模型4.5 Turbo显著提升关键信息抽取精度,并新增对昆仑芯、昇腾等国产硬件的支持。 具体更新亮点如下: 发布全场景文字识别模型PP-OCRv5: 单模型支持五种文字类型和复杂手写体识别;整体识别精度相比上一代提