阿里通义应用视觉团队负责人薄列峰离职

2025-05-08 發表於开源资讯

知情人士透露，阿里巴巴通义实验室应用视觉团队负责人薄列峰已于4月30日低调离职。

有消息称他已经加入刚刚进行架构调整的某互联网大厂，担任多模态模型部副总经理，向公司副总裁汇报。

薄列锋2007年博士毕业于西安电子科技大学，后来在芝加哥大学丰田研究院和华盛顿大学从事博士后研究，研究范围覆盖机器学习、深度学习、计算机视觉、自然语言处理、语音等多个领域。

2013-2017年期间，薄列峰就职于亚马逊西雅图总部，担任首席科学家（Principal Scientist），负责Amazon Go无人零售店的算法研发和落地。2017年10月，薄列峰加入京东数科，担任AI实验室首席科学家。2022年9月，薄列峰加入阿里，接替离职的谭平，担任达摩院XR实验室（X Lab）负责人。

此后，薄列峰转岗至阿里通义实验室，担任应用视觉团队负责人，成为阿里通义大模型图像和多模态方向的领军人物。

据知情人士透露，薄列峰加入某互联网大厂后，base地点在美国，可能是为了规避竞业影响。除了薄列峰之外，2月15日，阿里通义实验室语音团队负责人的鄢志杰也低调离职，加入某互联网大厂，担任Ai Lab副主任。

相關推薦

前阿里通义视觉负责人薄列峰加入腾讯混元团队

2025-07-29

2025年7月27日，前阿里通义实验室应用视觉团队负责人薄列峰确认加入腾讯混元大模型团队，直接向腾讯副总裁蒋杰汇报，负责多模态技术研发。据悉，薄列峰于2025年4月30日从阿里离职，此前曾主导阿里图像与视频AIGC技术，包

字节视觉大模型负责人今日内部官宣“暂时休息”

2025-07-18

，7月17日上午，字节跳动豆包大模型视觉多模态生成方向负责人杨建朝在公司内部宣布“暂时休息”，相关工作已完成交接，其职务由周畅（花名“时光”）接手。周畅所在架构为“多模态交互与世界模型”部门，向Seed基础研

前百度算法工程师、零一万物高管李先刚出任阿里通义语音实验室负责人

2025-06-18

、零一万物高管李先刚已加入阿里，担任通义语音实验室负责人。公开资料显示，李先刚博士毕业于北京大学，先后在百度、滴滴担任首席算法工程师。离开滴滴后，李先刚加入贝壳，任策略算法中心负责人。2023 年李先刚加

阿里云开源通义千问多模态大模型 Qwen-VL

2023-08-26

26 日「源创会」北京站，聊聊 AI 大模型与底层技术 >>> 阿里云推出大规模视觉语言模型Qwen-VL，并宣布直接开源。开源地址 ModelScope魔搭社区： Qwen-VL：https://modelscope.cn/models/qwen/Qwen-VL/summary Qwen-VL-Chat：https://modelscope.cn/m

阿里通义开源实首个音频生成模型 ThinkSound

2025-07-08

通义实验室首个音频生成模型 ThinkSound 现已正式开源，将打破“静音画面”的想象力局限。该模型首次把多模态大模型的思维链推理引入音频生成领域，让AI可以像专业音效师一样逐步思考，捕捉视觉细节，生成与画面同步的

阿里云开源通义千问 720 亿参数模型 Qwen-72B

2023-12-02

今天，阿里云举办通义千问发布会，开源通义千问720亿参数模型Qwen-72B。地址：https://modelscope.cn/models/qwen/Qwen-72B/ 据介绍，Qwen-72B在10个权威基准测评创下开源模型最优成绩，成为业界最强开源大模型，性能超越开源标杆Llama 2-70

阿里通义发布 Wan2.2-I2V-Flash 图生视频模型

2025-08-12

阿里通义大模型宣布推出其最新图生视频模型Wan2.2-12V-Flash。“它不仅将电影级视觉呈现装进模型，更在生成速度与性价比上实现全面跃升，致力于为用户带来更快速、更专业、更稳定的图生视频体验。” 相比 Wan2.1，Wan2.2-I2V-

Qwen2.5-Omni 登顶全球开源模型榜单

2025-04-03

Hugging Face 发布了最新的大模型榜单，阿里巴巴通义千问所推出的端到端全模态大模型 Qwen2.5-Omni 成功登顶。紧随其后的是 DeepSeek-V3-0324和群核的 SpatialLM-Llama-1B。 Qwen2.5-Omni 是一种端到端多模态模型，旨在感知文本、图像、音频

阿里淘宝第一个程序员“多隆”现已离职

2025-08-13

网传阿里“扫地僧”蔡景现已离职，其在阿里内外平台状态显示为“退隐江湖”。对此，阿里暂时没有回应。蔡景现（花名多隆）于2000年加入阿里巴巴，是淘宝第一个程序员。作为淘宝初创团队核心工程师，他主导构建了淘宝

阿里 AI 智能眼镜将在年底发布

2025-04-11

根据维深信息 Wellsenn XR 的独家报道，阿里已经确定了 AI 智能眼镜项目方案，目前正在积极招聘和扩充团队。据了解，阿里 AI 智能眼镜主要由智能信息事业群旗下的天猫精灵团队负责，硬件规格将超越目前火爆的 Ray-Ban Meta 智

阿里通义实验室发布 OmniAudio，可从 360° 视频生成空间音频

2025-05-31

阿里通义实验室语音团队宣布了一项在空间音频生成领域具有里程碑意义的研究 —— OmniAudio，它能够直接从 360° 视频生成空间音频，为虚拟现实和沉浸式娱乐带来了全新的可能性。为了解决「如何利用全景视频生成与之匹

阿里通义千问 Qwen3 全系适配 MLX

2025-06-18

阿里通义千问团队宣布正式开源 Qwen3 全系列 32 款 MLX 量化模型。 MLX 是开源机器学习框架，专为苹果芯片深度适配。MLX 框架可高效地训练和部署 AI 大模型，被越来越多的 AI 开发者采用。为更好服务开发者，通义团队推

中国大模型密集开源，影响几何？

2025-03-27

今年以来，中国大模型开源的消息一个接一个。阿里云通义千问从除夕夜开源全新的视觉模型Qwen2.5-VL，再到本月初发布并开源了全新推理模型QwQ-32B，在开源当日就登顶全球主流AI开源社区Hugging Face的趋势榜。 DeepSeek(深度求索)

阿里通义开源音频语言模型 Qwen2-Audio

2024-08-14

通义千问团队开源音频语言模型 Qwen2-Audio。这是 Qwen-Audio 的下一代版本，它能够接受音频和文本输入，并生成文本输出。具有以下特点：语音聊天：用户可以使用语音向音频语言模型发出指令，无需通过自动语音识别（ASR）

熱門推薦