阿里通义发布 Qwen3-30B-A3B-Instruct-2507 模型


Qwen3-30B-A3B 模型迎来了新版本:Qwen3-30B-A3B-Instruct-2507。

这是一个非思考模式(non-thinking mode)的新模型,仅激活3B参数,就能取得可媲美 Gemini 2.5-Flash(non-thinking)、GPT-4o等顶尖闭源模型的超强性能。

Qwen3-30B-A3B-Instruct-2507 在诸多方面实现了关键提升:

🌟通用能力大幅提升,包括指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等多方面;
🌟在多语言的长尾知识覆盖方面,模型进步显著;
🌟在主观和开放任务中,新模型与进一步紧密对齐了用户偏好,可以生成更高质量的文本,为用户提供更有帮助的回答;
🌟长文本理解能力提升至256K。

通义团队已在魔搭社区和HuggingFace等平台开源这一新模型,可前往QwenChat(chat.qwen.ai)直接体验。


相關推薦

2025-08-05

大学(1个)。 1、阿里(9个):编程模型Qwen3-Coder-30B-A3B-Instruct、Qwen3-Coder-480B-A35B-Instruct,深度思考模型Qwen3-30B-A3B-Thinking-2507、Qwen3-235B-A22B-Thinking-2507,基础模型Qwen3-235B-A22B-Instruct-2507、Qwen3-30B-A3B-Instruct-2507,CoT音频模型ThinkSound

2025-04-30

2025年4月29日,Qwen家族新成员Qwen3正式发布,包含多种模型版本。 1. 模型类型与参数 MoE 模型:有Qwen3-235B-A22B(总参数2350亿,激活参数220亿)和Qwen3-30B-A3B(总参数300亿,激活参数30亿)。 密集模型:包括Qwen3-32B、14B、8B、4B

2025-08-05

国际知名大模型评测 Chatbot Arena 日前公布最新榜单,Qwen3-235B-A22B-Instruct-2507 斩获 1433分,超越顶尖闭源模型 Grok4、Claude4、GPT4.1,Qwen3 位列总榜「全球第三」。 据悉,Chatbot Arena 采用盲测评价机制,是 AI 大模型领域最具影响力

2025-08-06

满足问答、推理、代码生成等多场景需求。 🧪 实验性发布 CUDA 12.8 镜像,镜像标签为 v1.8.1-cu128,欢迎体验并反馈使用效果。 📏 max_tokens 不设置时自动使用最大支持长度 提升推理结果完整性,避免因未设置 max_tokens 而被截

2023-11-01

Android 版本),用户开始可以下载相关APP进行体验。 阿里云CTO周靖人宣布,将在11月开源通义千问720亿参数模型,继续支持全球开发者开展模型和应用创新。 阿里云是国内最早开源自研大模型的头部科技企业,已先后开源

2023-09-14

多元共进|2023 Google 开发者大会精彩演讲回顾 阿里云9月13日宣布,通义千问大模型已首批通过备案,正式向公众开放。 用户可登录通义千问官网 (https://qianwen.aliyun.com) 体验,企业用户可以通过阿里云调用通义千问 API (https:/

2023-12-02

今天,阿里云举办通义千问发布会,开源通义千问720亿参数模型Qwen-72B。 地址:https://modelscope.cn/models/qwen/Qwen-72B/ 据介绍,Qwen-72B在10个权威基准测评创下开源模型最优成绩,成为业界最强开源大模型,性能超越开源标杆Llama 2-70

2025-08-06

商银行发布《软件开发中心智能研发平台》中标结果。 阿里云凭借通义灵码独家中标,根据中标公告,通义灵码将为工商银行智能研发平台提供代码补全、代码问答及单测智能体等服务。此前,工商银行已将阿里 Qwen 模型应用

2023-09-26

阿里云宣布开源通义千问140亿参数模型Qwen-14B及其对话模型Qwen-14B-Chat,免费可商用。据阿里云CTO周靖人介绍,Qwen-14B在多个权威评测中超越同等规模模型,部分指标甚至接近Llama2-70B。 Qwen-14B是一款支持多种语言的高性能开源模

2025-03-25

国内 AI 图像创作平台 LiblibAI 近日宣布接入阿里通义系列大模型。 此次接入后,基于万相最新开源模型,LiblibAI推出了文生视频和图生视频功能。用户只需输入文本提示词,或者上传图片,就能快速生成10秒短视频。这一功能的

2025-07-10

阿里巴巴通义实验室开源了一款名为HumanOmniV2的多模态推理模型,旨在解决现有模型在全局上下文理解不足和推理路径简单化的问题。该模型能够更精准地捕捉图像、视频、音频中的隐藏信息,从而更好地理解人类的复杂意图和

2024-08-14

通义千问团队开源音频语言模型 Qwen2-Audio。这是 Qwen-Audio 的下一代版本,它能够接受音频和文本输入,并生成文本输出。具有以下特点: 语音聊天:用户可以使用语音向音频语言模型发出指令,无需通过自动语音识别(ASR)

2025-06-18

阿里通义千问团队宣布正式开源 Qwen3 全系列 32 款 MLX 量化模型。 MLX 是开源机器学习框架,专为苹果芯片深度适配。MLX 框架可高效地训练和部署 AI 大模型,被越来越多的 AI 开发者采用。   为更好服务开发者,通义团队推

2023-08-26

26 日「源创会」北京站,聊聊 AI 大模型与底层技术 >>> 阿里云推出大规模视觉语言模型Qwen-VL,并宣布直接开源。 开源地址 ModelScope魔搭社区: Qwen-VL:https://modelscope.cn/models/qwen/Qwen-VL/summary Qwen-VL-Chat:https://modelscope.cn/m