百度 CTO 王海峰解读文心大模型 3.5 最新进展

2023-08-01 發表於开源资讯

百度首席技术官王海峰在近日举办的 ACM 中国图灵大会上，就文心大模型的核心技术进行了解读。

文心一言是百度自主研制的知识增强大语言模型，首先从数万亿数据和数千亿知识中融合学习得到预训练大模型，在此基础上采用有监督精调、人类反馈的强化学习和提示等技术，并具备知识增强、检索增强和对话增强等技术优势。

王海峰解读了文心大模型3.5的核心技术创新，通过飞桨与文心协同优化，文心大模型3.5实现了基础模型升级、精调技术创新、知识点增强、逻辑推理增强等，模型效果提升50%，训练速度提升2倍，推理速度提升30倍。

在基础模型训练上，采用了飞桨最先进的自适应混合并行训练技术及混合精度计算策略，并采用多种策略优化数据源及数据分布，加快了模型迭代速度，显著提升了模型效果和安全性。同时，百度研发团队创新了多类型多阶段有监督精调、多层次多粒度奖励模型、多损失函数混合优化策略、双飞轮结合的模型优化等技术，进一步提升模型效果及场景适配能力。

在知识增强和检索增强基础上，文心大模型3.5提出了“知识点增强技术”，使得模型能够更好地利用精细的知识点来提升理解生成等方面的能力，进而提升对世界知识的掌握和运用。

在推理方面，通过大规模逻辑数据构建、逻辑知识建模、多粒度语义知识组合以及符号神经网络技术，提升文心大模型3.5在逻辑推理、数学计算及代码生成等任务上的表现。

文心大模型3.5还新增了插件机制，包括官方插件百度搜索和 ChatFile，使得文心一言能够生成实时准确信息和长文本摘要，拓展了大模型能力边界。

根据 IDC 最新发布的《AI 大模型技术能力评估报告，2023》，百度文心大模型3.5在14个参评模型中拿下12项指标的7个满分，得到“综合评分第一，算法模型第一，行业覆盖第一”三个绝对第一。

此外，王海峰还在演讲中展示了文心一言的问答对话、文案生成、行程规划等能力，以及在办公、会议、编码等场景的应用。

对于大模型的产业模式，王海峰表示，在文心一言这类大模型产业落地的进程中，可以采用“集约化生产，平台化应用”的模式，即具有算法、算力和数据综合优势的企业将模型生产的复杂过程封装起来，通过低门槛、高效率的生产平台，为千行百业提供大模型服务，支撑产业智能化升级。

百度 CTO 王海峰解读文心大模型 3.5 最新进展

相關推薦

百度 CTO 王海峰：文心一言用户规模已达 4500 万

百度文心一言正式亮相

文心一言上线百度搜索、文档摘要、文本转视频等 5 个原生插件

互联网首位 AI 架构师诞生！百度文心快码实现从程序员到架构师的进阶

新华网大模型评测：文心一言多项第一

百度：闭源大模型+公有云已成为全球 AI 市场主流趋势

开源 AI 聊天、绘图软件 AIdea 最新版本 1.0.5 发布啦

挑战 ChatGPT，国产有这 8 款 AI 大模型产品

清华报告：文心一言稳坐国内第一，超越 ChatGPT

钉钉重注 AI：成立行业专属模型团队，向 CTO 汇报

李彦宏：下一代旗舰 ERNIE 大模型正在开发中

李彦宏谈 DeepSeek 现存痛点，称 Deepseek又慢又贵

百度官宣类 ChatGPT 大模型新项目：文心一言

百度与华为鸿蒙合作推出全新 AI 搜索模式：“百看计划”