阿里云开源通义千问 720 亿参数模型 Qwen-72B

2023-12-02 發表於开源资讯

今天，阿里云举办通义千问发布会，开源通义千问720亿参数模型Qwen-72B。

地址：https://modelscope.cn/models/qwen/Qwen-72B/

据介绍，Qwen-72B在10个权威基准测评创下开源模型最优成绩，成为业界最强开源大模型，性能超越开源标杆Llama 2-70B和大部分商用闭源模型。

通义千问-72B (Qwen-72B) 主要特性：

大规模高质量训练语料：使用超过3万亿tokens的数据进行预训练，包含高质量中、英、多语言、代码、数学等数据，涵盖通用及专业领域的训练语料。通过大量对比实验对预训练语料分布进行了优化。
强大的性能：Qwen-72B在多个中英文下游评测任务上（涵盖常识推理、代码、数学、翻译等），效果显著超越现有的开源模型。具体评测结果请详见下文。
覆盖更全面的词表：相比目前以中英词表为主的开源模型，

通义千问还开源了18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio。至此，通义千问共开源18亿、70亿、140亿、720亿参数的4款大语言模型，以及视觉理解、音频理解两款多模态大模型，实现“全尺寸、全模态”开源。

来源：https://mp.weixin.qq.com/s/lFeZToVywbkDUvKhsrKY7A

相關推薦

通义千问 APP 上线，通义千问 720 亿参数模型下月开源

2023-11-01

Android 版本），用户开始可以下载相关APP进行体验。阿里云CTO周靖人宣布，将在11月开源通义千问720亿参数模型，继续支持全球开发者开展模型和应用创新。阿里云是国内最早开源自研大模型的头部科技企业，已先后开源

阿里云最新财报：AI 收入实现三位数增长

2024-08-17

8月15日晚间，阿里巴巴集团发布最新季度业绩，AI推动阿里云重回增长，季度营收增长6%至265.49亿元，其中AI相关产品收入实现三位数增长，公共云业务实现两位数增长。同时，阿里云利润大涨，经调整EBITA利润同比增长155%，单季

阿里云通义千问 14B 模型开源

2023-09-26

阿里云宣布开源通义千问140亿参数模型Qwen-14B及其对话模型Qwen-14B-Chat，免费可商用。据阿里云CTO周靖人介绍，Qwen-14B在多个权威评测中超越同等规模模型，部分指标甚至接近Llama2-70B。 Qwen-14B是一款支持多种语言的高性能开源模

阿里发布 Qwen2-Math，超越 GPT-4o

2024-08-10

阿里通义团队开源新一代数学模型Qwen2-Math，包含1.5B、7B、72B三个参数的基础模型和指令微调模型。 Qwen2-Math基于通义千问开源大语言模型Qwen2研发，旗舰模型 Qwen2-Math-72B-Instruct在权威测评集MATH上的得分超越GPT-4o、Claude-3.5-Sonnet、

阿里云开源通义千问多模态大模型 Qwen-VL

2023-08-26

26 日「源创会」北京站，聊聊 AI 大模型与底层技术 >>> 阿里云推出大规模视觉语言模型Qwen-VL，并宣布直接开源。开源地址 ModelScope魔搭社区： Qwen-VL：https://modelscope.cn/models/qwen/Qwen-VL/summary Qwen-VL-Chat：https://modelscope.cn/m

中文大模型基准测评上半年报告：GPT-4o 排名第一、通义千问“国服最强”

2024-07-11

，OpenAI的GPT-4o以81分高居榜首，Claude-3.5-Sonnet与通义千问开源模型Qwen2-72B-Instruct并列第二，得分均为77。通义千问(Qwen2-72B)既是排名最高的中国大模型，也是全球最强的开源大模型，性能超越文心一言4.0、讯飞星火V4.0、Llama-3-70B

中国大模型密集开源，影响几何？

2025-03-27

今年以来，中国大模型开源的消息一个接一个。阿里云通义千问从除夕夜开源全新的视觉模型Qwen2.5-VL，再到本月初发布并开源了全新推理模型QwQ-32B，在开源当日就登顶全球主流AI开源社区Hugging Face的趋势榜。 DeepSeek(深度求索)

阿里巴巴 2025 财年收入 9963 亿元

2025-06-28

6月26日晚，阿里巴巴集团发布2025财年年报显示，2025财年阿里巴巴集团收入达9963.47亿元，净利润同比增长77%至1259.76亿元，展现出强劲的盈利能力。在AI需求的推动下，阿里云财年收入突破双位数增长，AI相关产品收入连续七个季

阿里云通义千问 AI 大模型正式向全社会开放

2023-09-14

多元共进｜2023 Google 开发者大会精彩演讲回顾阿里云9月13日宣布，通义千问大模型已首批通过备案，正式向公众开放。用户可登录通义千问官网 (https://qianwen.aliyun.com) 体验，企业用户可以通过阿里云调用通义千问 API (https:/

国家天文台基于通义千问打造国际首个太阳大模型“金乌”

2025-04-02

国家天文台联合阿里云发布国际首个太阳大模型——“金乌”。“金乌”基于通义千问系列开源模型打造，目前在M5级太阳耀斑预报上准确率超91%，为该级别太阳预报最高水平。根据介绍，基于Qwen-VL等模型，“金乌”太阳大

Qwen3 技术报告发布，详细介绍模型架构、训练方法与评估结果

2025-05-15

阿里巴巴正式发布了Qwen3系列大型语言模型的技术报告。报告详细阐述了Qwen3的模型架构、训练方法、数据处理、可扩展性以及全面的评估结果。 https://github.com/QwenLM/Qwen3/blob/main/Qwen3_Technical_Report.pdf Qwen3系列包括Qwen3-0.5B、

中科院多个研究所接入阿里千问 QwQ-32B

2025-03-21

中国科学院南海海洋研究所等多个中科院研究机构已接入阿里通义千问QwQ-32B，用最前沿的推理大模型提升科研效率。此前，依托通义千问大模型，国家天文台打造金乌大模型，用于分析、预测太阳耀斑，在X级耀斑的预测上，

速来体验丨MaxKB v1.10.7 LTS 版本发布，支持接入 Qwen3

2025-05-15

复。亮点更新 ■ MaxKB支持接入Qwen3 2025年4月29日，阿里巴巴开源新一代通义千问模型Qwen3。Qwen3系列模型包含2个混合专家（MoE）模型和6个稠密（Dense）模型，覆盖6亿、17亿、40亿、80亿、140亿、320亿、300亿、2350亿全尺寸参数

阿里通义千问启用新域名“tongyi.ai”

2024-08-22

阿里大语言模型通义千问宣布启用新域名「tongyi.ai」，并带来多项新功能。除了域名更新，网页版通义千问还在聊天页面中增加了深度搜索功能，该功能支持更多内容源索引，搜索结果更加深度、专业和结构化，数字角标悬

熱門推薦