百川智能发布 Baichuan2-192K 大模型，上下文窗口全球最长

2023-10-31 發表於开源资讯

10月30日，百川智能发布Baichuan2-192K大模型，其上下文窗口长度高达192K，是目前全球最长的上下文窗口。

上下文窗口长度是大模型的核心技术之一，通过更大的上下文窗口，模型能够结合更多上下文内容获得更丰富的语义信息，更好的捕捉上下文的相关性、消除歧义，进而更加准确、流畅的生成内容，提升模型能力。

据介绍，Baichuan2-192K能够处理约35万个汉字，是目前支持长上下文窗口最优秀大模型Claude2（支持100K上下文窗口，实测约8万字）的 4.4倍，更是 GPT-4（支持32K上下文窗口，实测约 2.5万字）的14倍。Baichuan2-192K不仅在上下文窗口长度上超越Claude2，在长窗口文本生成质量、长上下文理解以及长文本问答、摘要等方面的表现也全面领先Claude2。

Baichuan2-192K在Dureader、NarrativeQA、LSHT、TriviaQA等10项中英文长文本问答、摘要的评测集上表现优异，有7项取得SOTA，显著超过其他长窗口模型。

此外，LongEval的评测结果显示，在窗口长度超过100K后Baichuan2-192K依然能够保持非常强劲的性能，而其他开源或者商用模型在窗口长度增长后效果都出现了近乎直线下降的情况。Claude2也不例外，在窗口长度超过80K后整体效果下降非常严重。

今年9月25日，百川智能已开放了Baichuan2的API接口，正式进军企业级市场，开启商业化进程。此次Baichuan2-192K将以API调用和私有化部署的方式提供给企业用户，目前百川智能已经启动Baichuan2-192K的API内测，开放给法律、媒体、金融等行业的核心合作伙伴。

百川智能发布 Baichuan2-192K 大模型，上下文窗口全球最长

相關推薦

百川智能发布 70 亿参数开源中英文大模型 baichuan-7B

百川智能发布全球首个儿科大模型“福棠·百川”

百川智能开源医疗增强大模型 Baichuan-M2

百川开源大模型 Baichuan-13B 评测

Hugging News #0626: 音频课程更新、在线体验 baichuan-7B 模型

百川智能发布 53B 大模型，预计今年内追上 GPT-3.5

百川智能 A1 轮获阿里腾讯小米等 3 亿美元投资

李开复旗下 AI 公司「零一万物」完成数亿美元融资

百川智能完成 50 亿元融资，国内第三家估值 200 亿元大模型独角兽

挑战 ChatGPT，国产有这 8 款 AI 大模型产品

3 月全球人工智能领域新看点

两行代码解决大语言模型对话局限！港中文贾佳亚团队联合 MIT 发布超长文本扩展技术

蚂蚁集团百灵大模型通过备案，采用 Transfromer 架构

中国大模型市场份额报告：百度、商汤、智谱 AI 位列前三