蚂蚁集团副总裁、前基础大模型负责人徐鹏已离职。徐鹏一直从事人工智能领域技术研究,曾在谷歌工作11年,负责和领导了谷歌翻译的核心技术研发,并参与了谷歌显示广告系统的算法研发。
此前蚂蚁成立AI创新研发与应用部门NextEvo,由徐鹏担任负责人,承担了蚂蚁AI的所有核心技术研发,包括蚂蚁百灵大模型的所有研发工作。
据媒体报道,NextEvo部门几乎包揽了蚂蚁AI所有硬核研发任务——从底层技术到蚂蚁百灵大模型的全栈自研。此后,徐鹏也正式以“百灵一号位”身份对外亮相,成了蚂蚁AI牌桌上的门面人物。
就在上月,蚂蚁集团发布的最新研究论文,显示其推出了两款不同规模的MoE大语言模型——百灵轻量版(Ling-Lite)与百灵增强版(Ling-Plus),前者参数规模为168亿(激活参数27.5亿),Plus基座模型参数规模高达2900亿(激活参数288亿)。
实验表明,其3000亿参数的MoE大模型可在使用国产GPU的低性能设备上完成高效训练,性能与完全使用英伟达芯片、同规模的稠密模型及MoE模型相当。
近期,蚂蚁集团也在加码具身智能、AI眼镜等新方向——显然,大模型之外,蚂蚁在寻找更多破局点。在当前这个节点上,它需要向市场甩出更多筹码,讲出比“百灵”更具想象力的AI新故事。
相关阅读:蚂蚁集团采用国产 AI 芯片训练大模型,将计算成本降低约 20%