Qwen2.5-Omni 登顶全球开源模型榜单


Hugging Face 发布了最新的大模型榜单,阿里巴巴通义千问所推出的端到端全模态大模型 Qwen2.5-Omni 成功登顶。紧随其后的是 DeepSeek-V3-0324和群核的 SpatialLM-Llama-1B。

Qwen2.5-Omni 是一种端到端多模态模型,旨在感知文本、图像、音频和视频等多种模态,同时以流式方式生成文本和自然语音响应。开发团队表示,他们对 Qwen2.5-Omni 进行了全面评估,与类似大小的单模态模型和 Qwen2.5-VL-7B、Qwen2-Audio 和 Gemini-1.5-pro 等闭源模型相比,该模型在所有模态中均表现出色。

在需要集成多种模态的任务(例如 OmniBench)中,Qwen2.5-Omni 实现了最佳性能。此外,在单模态任务中,它在语音识别(Common Voice)、翻译(CoVoST2)、音频理解(MMAU)、图像推理(MMMU、MMStar)、视频理解(MVBench)和语音生成(Seed-tts-eval 和主观自然度)等领域表现出色。

据悉,阿里通义千问自成立以来,已经向全球开源了超过200款模型。这些模型覆盖了自然语言处理、计算机视觉等多个领域,为科研和企业应用提供了强有力的支持。而 Qwen 系列的衍生模型数量已经突破10万,超越了美国的 Llama 系列,成为全球最大的开源模型族群


相關推薦

2022-10-11

测试排行榜 ClickBench 中,新一代云原生数仓 SelectDB 强势登顶,性能表现超越一众国内外产品,多项指标排行前列,并在业界最为通用的 c6a.4xlarge, 500gb gp2 机型下排行全球第一! 在 ClickBench 性能排行榜中,测试数据均取自真实

2024-08-17

、推理、指令遵循、多语言理解等能力。Qwen2-72B发布后即登顶HuggingFace 的Open LLM Leaderboard开源模型榜单。中文大模型测评基准SuperCLUE在2024上半年报告中指出,Qwen2-72B成为排名第一的中国大模型,也是全球最强的开源模型,“超过

2024-02-02

2 月 1 日,数据库社区“墨天轮”公布了 2024 年最新一期中国数据库流行度排行榜,阿里云瑶池旗下的自研云原生数据库 PolarDB 夺冠,并刷新榜单总分纪录。墨天轮评价称,因云而生的 PolarDB 数据库以客户需求为导向,并在业界

2024-07-05

t: Wasm-Optimized Language Creates Less Code Than Rust)一经发出,即登顶the new stack的热门文章榜首。 在该篇报道中,资深科技记者 Loraine Lawson 与张宏波深入探讨了 MoonBit 在语言和工具链设计上的思路,在语言性能上针对 WebAssembly 技术实

2022-03-09

OBE 公布了 2022 年 3 月的编程语言排行榜。 自去年 10 月登顶后,Python 至今仍牢牢占据榜一的位置。而本月值得注意的是:脚本语言 Lua 挤掉了 Groovy ,重新回到了 TIOBE 榜单的前 20 名。 TIOBE CEO Paul Jansen 评价称,“在 2

2025-03-21

次上榜海外权威大模型竞技场 Chatbot Arena 最新排名,跻身全球 Top 15。 Chatbot Arena 发起方 LMSYS Org (加州大学伯克利分校等机构支持的非营利组织)通过官方X账号对腾讯混元的加入表示欢迎。 “这是腾讯混元旗舰模型首次入围

2025-03-27

本月初发布并开源了全新推理模型QwQ-32B,在开源当日就登顶全球主流AI开源社区Hugging Face的趋势榜。 DeepSeek(深度求索)达成过“开源周”,其在2月末连续五天发布五个代码库,并于近日继续开源上线了升级后的DeepSeek-V3模型。

2023-11-06

大语言模型测评MME中,综合得分排名第一。该评测首次对全球范围内MLLM模型进行了全面定量评测并公布了16个排行榜,包含感知、认知两个总榜单以及14个子榜单。Skywork-MM模型位列综合榜单第一,其中,感知榜单排名第一、认知

2023-09-07

讯优图实验室联合厦门大学在新建的评测基准MME上首次对全球范围内MLLM模型进行了全面定量评测并公布了16个排行榜,包含感知、认知两个总榜单以及14个子榜单。MME数据集是一个最近发布的多模态语言模型测评基准。MME通过评

2025-03-27

ureka O1作为全球首款音乐推理大模型,性能超越Suno、模型登顶SOTA,中国科技创新再次在AI音乐领域领跑全球。” 2024年4月,昆仑万维发布了第一代音乐生成模型:Mureka V1(SkyMusic)。Mureka V6是当前Mureka的基座模型,支持纯音乐生

2025-03-27

个开源模型的刷榜历史,还是在发布一小时后迅速吸引来全球用户对其测试体验。 根据目前最新的用户上手测试,新版 V3 模型前端编码能力的提升,是目前「感知最强」的部分。根据专业用户对新版 V3 的综合体验判断,V3-0324

2023-10-27

行榜 三大能力客观题OPT排行榜 十大基础能力榜单 开源模型排行榜 SuperCLUE 观点 国内第一梯队大模型经过11个月的努力,已经与GPT3.5极为接近。但与GPT4的距离依然巨大,尚未发现有对标和媲美GPT4的迹象。 国内大模

2022-11-30

升。 与此同时,我们将 1.2.0 RC 版本的测试数据提交到了全球知名的数据库测试排行榜 ClickBench,在最新的排行榜中,Apache Doris 以亮眼的性能表现登上榜单前列,取得了全球同类产品导入性能综合排名第一、通用机型(c6a.4xlarge,

2025-03-21

,腾讯宣布,混元大模型首次登上 Chatbot Arena 榜单,跻身全球 Top 15。用户在该平台上以匿名方式与多个模型互动,投票决定何种模型更佳,从而根据分数生成排行榜。这种测评也被看成是大模型直接 PK 的竞技场,简单直接。