微软 WizardLM 团队“集体跳槽”腾讯,或已并入混元大模型研发体系


外媒 TechCrunch 消息称,总部位于北京、曾隶属于微软的人工智能研究团队 WizardLM,近日被爆出已整体加入腾讯 AI 实验室旗下的“混元”团队。多位核心研究人员在社交平台 X(原推特)上宣布了这一动向。

在周二的帖子中,曾领导多个 WizardLM 项目的微软高级研究员 Can Xu 表示,他和团队已经离开微软,并正式加入腾讯混元团队。该团队近年来在视频生成、3D内容创作等多个方向发布了具有突破性的模型。

更引人关注的是,WizardLM 近期公开发布了名为 Hunyuan-TurboS0416 的模型,首次在产品命名中出现“混元”字样,显示其团队归属已与腾讯深度融合。据自称为 WizardLM 联合创始人的孙庆峰透露,该模型在多个基准测试中超越了谷歌最新开源大模型 Gemma3系列,被视为腾讯在开源对抗赛中的关键成果。

WizardLM 自成立以来便颇具争议。2024年4月,该团队发布了自研大模型 WizardLM-2,并宣称其能力接近 GPT-4,但仅一天后便遭到微软下架处理,原因是“未完成毒性测试”。尽管团队紧急补测并承诺重新发布,但原始模型已被社区快速传播和二次上传,微软难以控制。

这一事件也引发了开源圈强烈不满。Hugging Face CEO Clément Delangue 公开批评微软的下架行为“破坏了数十个开源项目”,强调 WizardLM 模型每月下载量曾超过十万次,对生态影响巨大。

WizardLM 团队加入之际,腾讯正加紧布局大模型生态。消息称,腾讯已重组混元大模型团队,划分为两个独立部门,并扩大基础设施投资。

在刚刚公布的2025年第一季度财报中,腾讯明确将营收同比增长的8%归因于 AI 战略升级,并宣布全年将投入 900亿元人民币(约合124.9亿美元) 用于资本支出,其中大部分将用于 AI 能力建设。

目前尚不清楚 WizardLM 团队是否整体加入腾讯,也不清楚其在微软的正式离职时间。微软和腾讯方面尚未就此变动发表公开声明。


相關推薦

2025-05-15

前微软北京AI研究团队WizardLM的核心成员Can Xu在社交媒体上宣布,他与WizardLM团队已离开微软,并加入了腾讯混元(Tencent Hunyuan)团队。他们将继续致力于推动大型语言模型(LLM)的训练技术发展,并构建更优质的AI模型。 C

2025-05-01

了全面重构,围绕算力、算法和数据三大核心板块,刷新团队部署,加码研发投入。 调整后,腾讯成立两个新的部门:大语言模型部和多模态模型部,分别负责探索大语言模型和多模态大模型的前沿技术,持续迭代基础模型

2023-08-05

根据多家媒体的报道,腾讯自研的“腾讯混元大模型”已经进入应用内测阶段。腾讯员工近期收到了内部邮件邀请,可以通过网页或者小程序体验混元大模型,腾讯内部多个业务也已经接入混元大模型进行测试。 腾讯表示,从

2025-05-23

腾讯混元宣布模型矩阵全面升级: 旗舰快思考模型混元TurboS、深度思考模型混元T1升级,并基于TurboS基座,腾讯新推出视觉深度推理模型T1-Vision和端到端语音通话模型混元Voice 腾讯混元图像2.0、腾讯混元3D v2.5及混元游戏视

2023-10-26

种人工智能生成内容,但不包括总结书籍等用途的应用。微软、OpenAI等投入1000万美元用于增强生成式AI产品的安全微软、OpenAI等公司合资1000万美元,任命Chris Meserole为“前沿模型论坛”的执行董事,旨在提高生成式AI产品的安全

2025-03-20

事会主席兼首席执行官马化腾透露,腾讯于数月前重组AI团队,聚焦产品创新及深度的模型研发,并加大了对原生AI产品的研发和营销力度。 马化腾表示:“数月前,我们重组了AI团队以聚焦于快速的产品创新及深度的模型研发

2024-05-18

5月17日上午,在腾讯生成式AI产业应用峰会上,腾讯副总裁、腾讯混元大模型负责人蒋杰透露称,将在今年三季度开源混元最核心的文生文模型。 蒋杰称,腾讯内部正在训练三种尺寸(S、M、L)的文生文模型供开源使用, S

2023-09-07

微信今天宣布,现已上线「腾讯混元助手」小程序。小程序页面显示,腾讯混元助手目前仅向受邀用户开放。 可以看到,腾讯的 AI 大模型被命名为“腾讯混元大模型”,「腾讯混元助手」则是基于该大模型的多模态对话 Bot

2025-03-21

腾讯混元通过官方公众号宣布,全新的推理模型 T1 将于本周五(北京时间 3 月 21 日 23 时)正式发布。 与此同时,腾讯宣布,混元大模型首次登上 Chatbot Arena 榜单,跻身全球 Top 15。用户在该平台上以匿名方式与多个模型互动

2023-09-27

产模型:通义千问,文心一言,讯飞星火,商汤日日新,腾讯混元大语言模型 开源大模型:Llama2 ,ChatGLM2 ,AquilaChat 7B ,Bloomz 7B 等,后续还将开放更多 文生图、图生图、超分辨率、黑白图片上色等功能,集成 Stable Diffusion

2025-04-17

汇报对象变为吴永辉。 字节 AI Lab 成立于2016年,最初由微软亚洲研究院前常务副院长马维英负责,直接向张一鸣汇报。 AI lab 目前有多个子团队,包括机器人、AI4S 等方向,几乎覆盖人工智能领域所有前沿技术研究。2018年其团

2024-07-27

立。其核心团队由来自搜狗、Google、腾讯、百度、华为、微软、字节等科技公司的AI人才组成。 在成立之初,百川智能就获得了天使轮5000万美元的启动资金。去年10月,百川智能宣布完成3亿美元的A1轮战略融资,并表示参投方

2025-05-23

先进的后训练策略:为了进一步增强模型能力,腾讯混元团队设计了包含四个关键模块的后训练流程: 1、监督微调(SFT):通过精心构建的百万级自然和合成指令数据进行微调。 2、自适应长短CoT融合:通过专门训练的教师模

2025-04-19

不同的角色特征。 同时,为了有效训练框架,腾讯混元团队还构建了一个包含千万级样本的大规模角色数据集。数据集被系统地组织为成对(多视角角色)和非成对(文本-图像组合)子集。这种双数据结构使得身份一致性和文