阿里通义应用视觉团队负责人薄列峰离职


知情人士透露,阿里巴巴通义实验室应用视觉团队负责人薄列峰已于4月30日低调离职。

有消息称他已经加入刚刚进行架构调整的某互联网大厂,担任多模态模型部副总经理,向公司副总裁汇报。

薄列锋2007年博士毕业于西安电子科技大学,后来在芝加哥大学丰田研究院和华盛顿大学从事博士后研究,研究范围覆盖机器学习、深度学习、计算机视觉、自然语言处理、语音等多个领域。

2013-2017年期间,薄列峰就职于亚马逊西雅图总部,担任首席科学家(Principal Scientist),负责Amazon Go无人零售店的算法研发和落地。2017年10月,薄列峰加入京东数科,担任AI实验室首席科学家。2022年9月,薄列峰加入阿里,接替离职的谭平,担任达摩院XR实验室(X Lab)负责人。

此后,薄列峰转岗至阿里通义实验室,担任应用视觉团队负责人,成为阿里通义大模型图像和多模态方向的领军人物。

据知情人士透露,薄列峰加入某互联网大厂后,base地点在美国,可能是为了规避竞业影响。除了薄列峰之外,2月15日,阿里通义实验室语音团队负责人的鄢志杰也低调离职,加入某互联网大厂,担任Ai Lab副主任。


相關推薦

2025-07-29

2025年7月27日,前阿里通义实验室应用视觉团队负责人薄列峰确认加入腾讯混元大模型团队,直接向腾讯副总裁蒋杰汇报,负责多模态技术研发。 据悉,薄列峰于2025年4月30日从阿里离职,此前曾主导阿里图像与视频AIGC技术,包

2025-07-18

,7月17日上午,字节跳动豆包大模型视觉多模态生成方向负责人杨建朝在公司内部宣布“暂时休息”,相关工作已完成交接,其职务由周畅(花名“时光”)接手。 周畅所在架构为“多模态交互与世界模型”部门,向Seed基础研

2025-06-18

、零一万物高管李先刚已加入阿里,担任通义语音实验室负责人。 公开资料显示,李先刚博士毕业于北京大学,先后在百度、滴滴担任首席算法工程师。离开滴滴后,李先刚加入贝壳,任策略算法中心负责人。2023 年李先刚加

2023-08-26

26 日「源创会」北京站,聊聊 AI 大模型与底层技术 >>> 阿里云推出大规模视觉语言模型Qwen-VL,并宣布直接开源。 开源地址 ModelScope魔搭社区: Qwen-VL:https://modelscope.cn/models/qwen/Qwen-VL/summary Qwen-VL-Chat:https://modelscope.cn/m

2025-07-08

通义实验室首个音频生成模型 ThinkSound 现已正式开源,将打破“静音画面”的想象力局限。 该模型首次把多模态大模型的思维链推理引入音频生成领域,让AI可以像专业音效师一样逐步思考,捕捉视觉细节,生成与画面同步的

2023-12-02

今天,阿里云举办通义千问发布会,开源通义千问720亿参数模型Qwen-72B。 地址:https://modelscope.cn/models/qwen/Qwen-72B/ 据介绍,Qwen-72B在10个权威基准测评创下开源模型最优成绩,成为业界最强开源大模型,性能超越开源标杆Llama 2-70

2025-04-03

Hugging Face 发布了最新的大模型榜单,阿里巴巴通义千问所推出的端到端全模态大模型 Qwen2.5-Omni 成功登顶。紧随其后的是 DeepSeek-V3-0324和群核的 SpatialLM-Llama-1B。 Qwen2.5-Omni 是一种端到端多模态模型,旨在感知文本、图像、音频

2025-04-11

根据维深信息 Wellsenn XR 的独家报道,阿里已经确定了 AI 智能眼镜项目方案,目前正在积极招聘和扩充团队。 据了解,阿里 AI 智能眼镜主要由智能信息事业群旗下的天猫精灵团队负责,硬件规格将超越目前火爆的 Ray-Ban Meta 智

2025-05-31

阿里通义实验室语音团队宣布了一项在空间音频生成领域具有里程碑意义的研究 —— OmniAudio,它能够直接从 360° 视频生成空间音频,为虚拟现实和沉浸式娱乐带来了全新的可能性。 为了解决「如何利用全景视频生成与之匹

2025-06-18

阿里通义千问团队宣布正式开源 Qwen3 全系列 32 款 MLX 量化模型。 MLX 是开源机器学习框架,专为苹果芯片深度适配。MLX 框架可高效地训练和部署 AI 大模型,被越来越多的 AI 开发者采用。   为更好服务开发者,通义团队推

2025-03-27

今年以来,中国大模型开源的消息一个接一个。 阿里云通义千问从除夕夜开源全新的视觉模型Qwen2.5-VL,再到本月初发布并开源了全新推理模型QwQ-32B,在开源当日就登顶全球主流AI开源社区Hugging Face的趋势榜。 DeepSeek(深度求索)

2022-03-28

Chris McKillop 是 Google Fuchsia OS 的负责人兼工程总监,近日他在个人社交媒体上宣布已经从 Google 离职。 在 2016 年,Google 就在 GitHub 上提交了 Fuchsia OS 的代码,也正是在那个时候,Fuchsia OS 进入了大众的视野。Fuchsia OS 是 Google 在 A

2024-08-14

通义千问团队开源音频语言模型 Qwen2-Audio。这是 Qwen-Audio 的下一代版本,它能够接受音频和文本输入,并生成文本输出。具有以下特点: 语音聊天:用户可以使用语音向音频语言模型发出指令,无需通过自动语音识别(ASR)

2025-07-10

阿里巴巴通义实验室开源了一款名为HumanOmniV2的多模态推理模型,旨在解决现有模型在全局上下文理解不足和推理路径简单化的问题。该模型能够更精准地捕捉图像、视频、音频中的隐藏信息,从而更好地理解人类的复杂意图和