彭博推出 BloombergGPT,金融领域的大型语言模型


彭博 (Bloomberg) 发布了一篇研究报告,详细介绍了新型的大规模生成式 AI 模型 BloombergGPT 的开发。这种大型语言模型(LLM)专门针对各种金融数据进行了训练,以支持金融行业内多样化的自然语言处理(NLP)任务。

公告称,基于 LLM 的 AI 的最新进展已经在许多领域展示了令人兴奋的新应用,但金融领域的复杂性和独特术语需要一个特定领域的模型。“BloombergGPT 代表了为金融行业开发和应用这种新技术的第一步”。

该模型将协助彭博改进现有的金融 NLP 任务,如情感分析、命名实体识别、新闻分类和问答等。此外,BloombergGPT 将为彭博终端上的大量数据释放新的机会,将 AI 的全部潜力带入金融领域。

"Bloomberg 支持大量多样的 NLP 任务,这些任务将受益于新的金融感知语言模型。彭博研究人员开创了一种混合方法,将金融数据与通用数据集相结合,以训练一个在金融基准上取得优异成绩的模型,同时在通用 LLM 基准上保持有竞争力的表现。"

彭博的 ML 产品和研究小组与该公司的 AI 工程团队合作,利用其现有的数据创建、收集和管理资源,构建了迄今为止最大的特定领域数据集之一。作为一家金融数据公司,彭博的数据分析师在过去的四十年里一直在收集和维护金融语言文档。得益于此,该团队从这个广泛的金融数据档案中提取数据,创建了一个由英文金融文件组成的 3630 亿标记综合数据集。

根据介绍,该数据集与一个 3450 亿标记的公共数据集相结合,创建了一个超过 7000 亿标记的大型训练语料库。利用该训练语料库的一部分内容,团队训练了一个具有 500 亿参数的仅解码器的因果语言模型。由此生成的模型在现有的针对金融的 NLP 基准、一套彭博内部基准以及来自热门基准的通用 NLP 任务的广泛类别(如 BIG-bench Hard、知识评估、阅读理解和语言任务)上进行了验证。

彭博方面称,在金融任务上,BloombergGPT 模型在很大程度上优于类似规模的现有开放模型,同时在通用 NLP 基准上表现相当或更好。

彭博首席技术官 Shawn Edwards 表示:“出于各种原因,生成式 LLM 非常具有吸引力,譬如小样本学习、文本生成、对话系统等;我们看到了开发首个专注于金融领域的 LLM 的巨大价值。BloombergGPT 将使我们能够处理许多新型应用程序,同时它为每个应用程序提供比定制模型更高的开箱即用性能,并且上市时间更快。”

有关 BloombergGPT 开发的更多详细信息,可查看 arXiv 上的论文。


相關推薦

2023-07-25

巨大的机遇。此外,开源PHP继“Gitee”平台后,今年还将推出其自己的“Hugging Face”平台,届时JIANG或将成为第一批开源的中国本土的大模型之一。 本次发布会的主讲人为知未智能的联合创始人兼CTO段清华,毕业于北京大学计

2023-11-10

应时间更快、不需要网络连接,且更具隐私性。 上个月彭博社的报道也提到了苹果公司内部对如何部署生成式 AI 的争论:完全在设备上运行、基于云运行或介于两者之间。 部署在设备上会运行得更快,并有助于保护隐私,但

2023-02-28

ChatGPT 持续火热,大型科技公司争先恐后地涌入 AI 军备竞赛中,这也为 AI 领域又带来了一个新的模型与潜在竞争对手 —— LLaMA。 LLaMA 语言模型全称为 "Large Language Model Meta AI",是 Meta 近日公布的一个全新的大型语言模型(LLM

2023-03-02

时期。 智源研究院2020年搭建大模型攻关团队,2021年6月推出当时规模最大、性能领先多模态大模型“悟道2.0”。为了推动大模型方向的协同创新,在“科技创新2030”新一代人工智能重大科技项目支持下,2023年初,智源研究院

2023-11-11

彭博社援引消息人士的话报道称,AI 初创公司 Stability AI 已获得了由英特尔领投的新一轮融资。该公司在这笔交易中以可转换票据的形式筹集了近 5000 万美元,交易于 10 月份完成。 Stability AI 是 Stable Diffusion 背后的公司,Stable Di

2022-04-13

微软宣布推出一种可以提高大型语言模型性能的新工具 Jigsaw。“大型的预训练语言模型(如 GPT-3、Codex 等),可以被调整为从程序员意图的自然语言规范中生成代码。这种自动化模型有可能提高世界上每个程序员的生产力;但

2023-09-22

行业的大规模预训练模型技术和应用评估方法第1部分:金融大模型》发布成为国内首个金融行业大模型标准,为金融行业智能化的高质量发展提供了重要支撑,为全面促进大模型安全合规和可信发展提供了重要保障。 具体来看

2023-10-26

游戏、内容等领域广泛应用。🤖📱💼AI应用阿里国际站推出AI生意助手阿里巴巴国际站推出了全新的AI工具——生意助手Smart Assistant,旨在通过AI技术提高外贸商家的运营效率、提升转化率和寻找商机。【AiBase提要:】🤖 阿里巴

2024-03-13

近年来,人工智能技术快速渗透各行各业,金融业也不例外。不少金融机构开始尝试将人工智能技术应用于风险防控领域,用科技创新来防范金融风险。 当前,我国在“人工智能+风控”领域进行了积极的尝试与探索,与国际金

2023-10-24

OSC 请你来轰趴啦!1028 苏州源创会,一起寻宝 AI 时代 彭博社近日的报道透露了苹果公司内部对生成式 AI 技术的反应。 这篇报道引用了苹果首席执行官 Tim Cook 的原话:“苹果多年来一直致力于生成式 AI 技术。但我可以明确地

2023-11-06

为第一批模型伙伴和投资伙伴。 2023年8月23日,昆仑万维推出国内第一款AI搜索产品——“天工AI搜索”,并开启内测申请。“天工AI搜索”深度融合AI大模型能力,通过人性化、智能化的方式全面提升用户的搜索体验,为用户提

2023-03-01

2月28日,跬智信息(Kyligence)宣布全新推出国产化云原生数据底座开源项目玄武(XUANWU),以助力企业加速数据平台上云,并实现国产化升级。玄武(XUANWU)是在容器化技术上形成的新一代云原生大数据底座,旨在提供一套整体

2023-04-01

些外部开源贡献者对开源所做出的特殊贡献。 日前,彭博社宣布成立了旗下首个 FOSS 贡献者基金(FOSS Contributor Fund),并启动了首轮员工投票,该基金由公司开源项目办公室(OSPO)和企业慈善部门共同合作。 慈善事业和

2023-07-08

供使用行业公开数据训练的行业通用大模型,包括政务,金融,制造,矿山,气象等大模型;也可以基于行业客户的自有数据,在盘古大模型的L0和L1层上,为客户训练自己的专有大模型。 L2层为客户提供了更多细化场景的模型