百度 CTO 王海峰解读文心大模型 3.5 最新进展


百度首席技术官王海峰在近日举办的 ACM 中国图灵大会上,就文心大模型的核心技术进行了解读。

文心一言是百度自主研制的知识增强大语言模型,首先从数万亿数据和数千亿知识中融合学习得到预训练大模型,在此基础上采用有监督精调、人类反馈的强化学习和提示等技术,并具备知识增强、检索增强和对话增强等技术优势。

王海峰解读了文心大模型3.5的核心技术创新,通过飞桨与文心协同优化,文心大模型3.5实现了基础模型升级、精调技术创新、知识点增强、逻辑推理增强等,模型效果提升50%,训练速度提升2倍,推理速度提升30倍。

在基础模型训练上,采用了飞桨最先进的自适应混合并行训练技术及混合精度计算策略,并采用多种策略优化数据源及数据分布,加快了模型迭代速度,显著提升了模型效果和安全性。同时,百度研发团队创新了多类型多阶段有监督精调、多层次多粒度奖励模型、多损失函数混合优化策略、双飞轮结合的模型优化等技术,进一步提升模型效果及场景适配能力。

在知识增强和检索增强基础上,文心大模型3.5提出了“知识点增强技术”,使得模型能够更好地利用精细的知识点来提升理解生成等方面的能力,进而提升对世界知识的掌握和运用。

在推理方面,通过大规模逻辑数据构建、逻辑知识建模、多粒度语义知识组合以及符号神经网络技术,提升文心大模型3.5在逻辑推理、数学计算及代码生成等任务上的表现。

文心大模型3.5还新增了插件机制,包括官方插件百度搜索和 ChatFile,使得文心一言能够生成实时准确信息和长文本摘要,拓展了大模型能力边界。

根据 IDC 最新发布的《AI 大模型技术能力评估报告,2023》,百度文心大模型3.5在14个参评模型中拿下12项指标的7个满分,得到“综合评分第一,算法模型第一,行业覆盖第一”三个绝对第一。

此外,王海峰还在演讲中展示了文心一言的问答对话、文案生成、行程规划等能力,以及在办公、会议、编码等场景的应用。

对于大模型的产业模式,王海峰表示,在文心一言这类大模型产业落地的进程中,可以采用“集约化生产,平台化应用”的模式,即具有算法、算力和数据综合优势的企业将模型生产的复杂过程封装起来,通过低门槛、高效率的生产平台,为千行百业提供大模型服务,支撑产业智能化升级。


相關推薦

2023-10-20

相约开源PHP办公室,我们一起聊 AI!>>> 百度首席技术官王海峰在解读文心大模型 4.0 背后的关键技术和最新进展时表示,文心大模型 4.0 的理解、生成、逻辑、记忆四大能力都有显著提升。 文心大模型4.0在9月已开始小流量上线

2023-03-20

百度会迅速提升。 技术架构 & 特性 百度首席技术官王海峰在发布会上详解了文心一言背后的文心大模型及技术特性。 百度在人工智能四层架构中有全栈布局:包括底层的芯片、深度学习框架、大模型以及最上层的搜索等

2023-08-18

6 日举行 WAVE SUMMIT 深度学习开发者大会,百度首席技术官王海峰在大会上表示,文心一言大模型现已上线 5 个原生插件:百度搜索、览卷文档、E 言易图、说图解画、一镜流影。 同时,文心一言现已支持一次同时使用 3 个插件

2023-08-06

一言、GPT-3.5等四大知名大模型为例进行评测,结果显示百度文心一言综合得分第一,超过GPT-3.5,国内大模型排名第一。 内容价值是企业选择大模型重要因素 大模型具有良好的通用性和泛化性。普通人通过简单的问答,就能

2023-09-27

GPT-4 Anthropic 的 Claude instant, Claude 2.0 阿里的通义千问 百度的文心一言 科大讯飞的讯飞星火 商汤日日新 腾讯混元大模型 开源大模型 Llama2 70B 开源大模型 Llama2 7B 中文版 开源大模型 ChatGLM2 6B 开源大模型 AquilaChat 7B

2023-09-08

Google 开发者在线课程 开始学习 8 月 31 日,百度、字节、商汤、中科院旗下紫东太初、百川智能、智谱华章等 8 家企业 / 机构的大模型产品已经首批通过《生成式人工智能服务管理暂行办法》备案,可正式上线面向公众提供服

2023-08-11

团队近日发布的《大语言模型综合性能评估报告》显示,百度文心一言在三大维度20项指标中综合评分国内第一,超越ChatGPT,其中中文语义理解排名第一,部分中文能力超越GPT-4。 据了解,报告本次评估选取了GPT-4、ChatGPT 3.5、

2023-02-08

在谷歌宣布推出与 ChatGPT 竞争的 AI 产品 Bard 后,百度微信公众号今日也官宣介绍了该公司的大模型新项目 —— 文心一言(英文名 ERNIE Bot)。公告注释称: ①.百度在人工智能四层架构中,有全栈布局。包括底层的芯片、

2023-10-27

通用大语言模型。与9月相比,新增了月之暗面的Moonshot、百度的文心一言4.0、科大讯飞的星火V3.0、vivo的vivoLM和阿里云的Qwen-14B。 评测发现,国内第一梯队大模型格局已基本形成,在过去11个月的成绩令人振奋,头部几个中文

2023-04-08

百度官方发布声明称,其公司就 App Store 和各种应用商店上存在大量盗版“文心一言”App 的问题,已向北京市海淀区人民法院对苹果公司及相关开发者团队发起诉讼。 百度官方声明: 目前文心一言没有任何官方APP!在我司

2023-10-19

的前两天),相约开源PHP办公室,我们一起聊 AI!>>> 在百度世界 2023 大会上,百度创始人、董事长兼首席执行官李彦宏宣布文心大模型 4.0 正式发布,开启邀请测试。 李彦宏表示,文心大模型 4.0 是迄今为止最强大的文心大模

2023-10-26

百度开放文心4.0开发权限申请在2023年百度世界大会上,百度发布了文心大模型4.0,提升了理解、生成、逻辑、记忆等四个方面,现在开发者可以申请使用 ERNIE Bot SDK 开发与接入该模型的应用。申请地址:https://aistudio.baidu.com/communi

2023-10-24

助力企业从经验管理提升至量化管理。同时,AI提词支持百度文心一言大语言模型;DevOps安装时支持一键安装多个相关应用、支持使用命令行进行版本升级,大幅提升安装和升级效率。 新增功能点 度量项: BI二级菜单

2023-06-08

6月6日,在文心大模型技术交流会(成都)上,百度智能云推出了基于大模型的“Comate”代码助手,并正式开放邀请测试。 据介绍,借助文心大模型的理解、推理能力,“Comate”可实现代码的快速补齐、自然语言推荐代码、自