中国大模型密集开源,影响几何?


今年以来,中国大模型开源的消息一个接一个。

阿里云通义千问从除夕夜开源全新的视觉模型Qwen2.5-VL,再到本月初发布并开源了全新推理模型QwQ-32B,在开源当日就登顶全球主流AI开源社区Hugging Face的趋势榜。

DeepSeek(深度求索)达成过“开源周”,其在2月末连续五天发布五个代码库,并于近日继续开源上线了升级后的DeepSeek-V3模型。 阶跃星辰则在一个月左右时间开源三款多模态大模型,其最新开源的是图生视频模型Step-Video-TI2V,支持生成的视频具备运动幅度可控和镜头运动可控两大核心特点,同时自带一定的特效生成能力。

为何开源大模型成为中国当前的发展潮流?FutureLabs未来实验室首席专家胡延平对中新社记者表示,大模型厂商普遍选择开源,且有强劲的市场爆发力,是因为人工智能发展处在四个重要时刻。

一是端侧智能的需求崛起,包括个人单机部署AI方面的需求,推动端侧智能快速发展。

二是企业行业AI部署的需求驱动,千行百业AI需求激增,但通用云端大模型难以满足差异化的业务场景与数据隐私保护的需要。开源凭借灵活性和定制化能力,成为企业实现差异化部署的首选,开源模型体现出随需应变的明显优势。

中新社记者获取的数据显示,截至3月25日,通义千问开源模型Qwen系列的全球下载量已超2亿。通过千千万万的开发者和中小企业,通义大模型深入千行百业,包括医疗、教育、金融、电力、交通、计算机等。

三是AI产业生态化进入加速时刻,出现分工协作体系,上下游协作关系更为清晰。头部企业聚焦模型能力强化,中小企业则基于开源模型开发细分场景应用,形成企业数量更大的产业腰部、大模型后市场,这是一个分工日趋明确的产业生态。

四是AI大模型能力提升显著,从“可用”进入“高可用”时刻,用户、应用由此进入爆发性增长时刻。

据中国工信部官方消息,目前,中国已成为全球开源参与者数量排名第二、增长速度最快的国家。另有数据显示,阿里通义开源模型的衍生模型数量已突破10万个,成为全球最大的开源模型族群。

中国大模型密集开源,影响几何?

中国科学院院士梅宏曾表示,大语言模型在未来需要像互联网一样,走向开源,由全世界共同维护一个开放共享的基础模型,尽力保证其与人类知识的同步。否则,任何一个机构所掌控的基础模型都难以让其他机构用户放心地上传应用数据,也就很难产生足以满足各行各业业务需求的大量应用。

胡延平说,以通义千问为代表的中国大模型正借助这一波开源大势,缩小与全球领先AI技术的差距,最重要的是中国开源的生态化获得极大成功,为今后发展积蓄了较强势能。

阿里云高级总监朱迅垚认为,现在大家逐步认识到,开源模型将成为推动中国人工智能发展最强劲的引擎。下一步,建议从国家到地方再到企业,以更加积极的态度拥抱开源,同时在布局智能算力、构建高质量数据集、上云用云等方面加快创新步伐,紧跟世界先进水平。

有外媒近日报道称,中国科技公司选择开源路线,不仅是为了与同类型公司展开竞争,更是为了加速AI的采用和创新。开源模型降低了成本,为产品创新打开了大门。这一趋势不仅将推动中国AI领域的快速发展,甚至可能缩短技术差距。 (中新社 记者 夏宾)


相關推薦

2023-08-04

作,最新发布了 Top 10 for LLM 的 1.0 版本,专门针对大语言模型(LLM)应用相关风险。旨在为开发人员、数据科学家和安全专家提供实用、可操作和简明的安全指南,帮助他们驾驭复杂多变的 LLM 安全领域。 “急于利用 LLM 潜力的

2023-06-29

6月28日,上海世界移动通信大会期间,中国联通发布图文大模型“鸿湖图文大模型1.0”,并表示这是首个面向运营商增值业务的大模型。 鸿湖图文大模型目前拥有8亿训练参数和20亿训练参数两个版本,可以实现以文生图、视频

2024-10-15

苹果近日发布多模态大模型 MM1.5,旨在增强对文本丰富的图像的理解、视觉指代和接地,以及多图像推理的能力。 据悉, MM1.5在在 MM1 架构的基础上训练而成,MM1.5 采用了以数据为中心的模型训练方法,在整个模型训练生命周

2024-08-10

ath 和 MMLU-STEM 上评估了 Qwen2-Math 基模型。以及评估了三个中国数学基准 CMATH,GaoKao Math Cloze 和 GaoKao Math QA。所有评估均使用 Few-shot CoT 方式。 按照Qwen团队的说法,他们在预训练和微调数据集上都进行了去污染处理。具体来说

2024-01-13

中国电信宣布将自研星辰 AI 大型模型全面开源,公开其底层代码、算法逻辑及其预制的各种基础大模型、开发模块、训练工具等核心产品能力。 用户既可以直接调用大模型,也可以根据自身业务需求对大模型进行微调或个性化

2024-04-18

近日中国电信开源了12B参数规模星辰语义大模型TeleChat-12B。相较于1月开源的7B版本,内容、性能和应用等方面整体效果提升了30%。其中,多轮推理、安全问题等领域提升超40%。另外,据了解,中国电信将于年内开源千亿级参数大

2024-10-19

东师范大学、上海交通大学、复旦大学、北京科技大学、中国传媒大学、澳门理工大学、天津中教开源创新研究院等学术界专家,与来自华为、红帽软件、RT-Thread(睿赛德)、DaoCloud道客、PingCAP、大成律所、君悦律所等产业界代

2023-07-05

于 6 月 30 日下午正式宣布成立。 清华大学校长王希勤,中国科学院院士、清华大学人工智能研究院名誉院长张钹,中国工程院院士、清华大学网研院院长、中关村实验室主任吴建平,中国工程院院士、清华大学人工智能研究院

2023-10-13

p)的大模型部分主要包括以下几个方面: 备案上线的中国大模型:有牌照提供服务的大模型,需要注意的是大模型和相应的产品多半名称不同。 知名大模型:在全球范围内,已经发布了多款知名大模型,这些大模型在各个

2022-09-10

别项目。 骆涛,百度资深研发工程师 骆涛博士毕业于中国科学技术大学,研究方向高性能计算,目前负责 Paddle 主框架开源生态建设。 彭靖田,品览联合创始人兼CTO 彭靖田是 Google Developers Expert,加州大学访问学者,毕业

2024-05-27

中国电信人工智能研究院(TeleAI)于近日发布了业内首个支持30种方言自由混说的语音识别大模型——星辰超多方言语音识别大模型,可同时识别理解粤语、上海话、四川话、温州话等30多种方言,是目前国内支持最多方言的语

2023-11-07

浸大的单肖文教授代在会上表示,OpenGeometry 开源社区对中国工业软件界意义很大,是构筑工业软件的“根”,只有“根”扎得深,工业软件的树才能枝繁叶茂。

2023-03-02

力需求,科技部正在推动建设“国家公共算力平台”和“中国算力网”,为科技创新和产业智能化转型提供普惠算力。他同时指出,大模型发展需要技术创新与伦理治理并重,科技部也将组织探索研究大模型的伦理治理问题,让

2023-06-17

构、开源社区等共同发布“共建人工智能框架生态,繁荣中国人工智能产业”联合倡议,倡议通过政产学研用的共同努力,支撑中国人工智能框架生态走向新高度,推进中国人工智能产业新发展。 《共建人工智能框架生态倡