智谱 AI 官宣:ChatGLM2-6B 可免费商用


中英双语大模型 ChatGLM2-6B 开发团队——智谱AI&清华KEG昨晚宣布即日起 ChatGLM-6B 和 ChatGLM2-6B 权重对学术研究完全开放,并且在完成企业登记获得授权后,允许免费商业使用

ChatGLM2-6B 是开源中英双语对话模型 ChatGLM-6B 的第二代版本,在保留了初代模型对话流畅、部署门槛较低等众多优秀特性的基础之上,ChatGLM2-6B 引入了如下新特性:

  • 更强大的性能:基于 ChatGLM 初代模型的开发经验,全面升级了 ChatGLM2-6B 的基座模型。ChatGLM2-6B 使用了 GLM 的混合目标函数,经过了 1.4T 中英标识符的预训练与人类偏好对齐训练,评测结果显示,相比于初代模型,ChatGLM2-6B 在 MMLU(+23%)、CEval(+33%)、GSM8K(+571%) 、BBH(+60%)等数据集上的性能取得了大幅度的提升,在同尺寸开源模型中具有较强的竞争力。
  • 更长的上下文:基于 FlashAttention 技术,项目团队将基座模型的上下文长度(Context Length)由 ChatGLM-6B 的 2K 扩展到了 32K,并在对话阶段使用 8K 的上下文长度训练,允许更多轮次的对话。但当前版本的 ChatGLM2-6B 对单轮超长文档的理解能力有限,我们会在后续迭代升级中着重进行优化。
  • 更高效的推理:基于 Multi-Query Attention 技术,ChatGLM2-6B 有更高效的推理速度和更低的显存占用:在官方的模型实现下,推理速度相比初代提升了 42%,INT4 量化下,6G 显存支持的对话长度由 1K 提升到了 8K。

示例对比

相比于初代模型,ChatGLM2-6B 多个维度的能力都取得了提升,以下是一些对比示例。

数理逻辑

知识推理

长文档理解


相關推薦

2023-07-22

作智谱 AI,共研千亿级大语言模型 360GLM 智谱 AI 官宣:ChatGLM2-6B 可免费商用

2023-06-29

即刻体验百川-7B 模型: https://hf.co/spaces/ysharma/baichuan-7B ChatGLM2-6B 重磅发布,荣登 Hugging Face 趋势榜单之首! ChatGLM2-6B 是开源中英双语对话模型 ChatGLM-6B 的第二代版本,在保留了初代模型对话流畅、部署门槛较低等众多优秀特

2023-07-27

eGeeX2 是多语言代码生成模型 CodeGeeX 的第二代模型,基于 ChatGLM2 架构注入代码实现。 我们希望每一位程序员,都能在自己机器上跑上一个自己的编程助手。为实现这一目标,我们现将「代码生成模型 CodeGeeX2-6B」开源。同时我

2023-09-27

汤日日新,腾讯混元大语言模型 开源大模型:Llama2 ,ChatGLM2 ,AquilaChat 7B ,Bloomz 7B 等,后续还将开放更多 文生图、图生图、超分辨率、黑白图片上色等功能,集成 Stable Diffusion 模型,支持 SDXL 1.0 今天最新版本的 1.0.5 发布

2023-09-01

介绍,该助手基于智谱 AI 自主研发的中英双语对话模型 ChatGLM2,经过万亿字符的文本与代码预训练,并采用有监督微调技术,以通用对话的形式为用户提供智能化服务。 「智谱清言」可作为用户的智能助手在工作、学习和日常

2023-09-22

要被干掉? 36氪从多名独立信源处获悉,大模型公司“智谱AI”于近日完成 B-4 轮融资。其中,腾讯战投、阿里巴巴战投等多家机构参与投资。该轮融资完成后,智谱AI的估值达到约10亿美金。 对此,智谱 AI 方不予置评,腾讯

2023-10-21

前两天),相约开源PHP办公室,我们一起聊 AI!>>> 北京智谱华章科技有限公司(简称“智谱AI”)宣布,今年已累计获得超 25 亿人民币融资。 参与方主要包括社保基金中关村自主创新基金(君联资本为基金管理人)、美团、

2023-09-08

能。 该助手基于智谱 AI 自主研发的中英双语对话模型 ChatGLM2,经过万亿字符的文本与代码预训练,并采用有监督微调技术,以通用对话的形式为用户提供智能化服务。“智谱清言” 作为用户的智能助手,可在工作、学习和日

2023-09-22

能四世同堂,凭什么开发 30 岁就要被干掉? deepin 正式官宣已实现大模型能力接入,多款自研应用软件实现智能化升级。 统信软件高级副总经理、CTO张磊表示:“目前UOS AI实现了国内外主流大模型的能力接入,并封装成deepin

2023-02-08

ChatGPT 竞争的 AI 产品 Bard 后,百度微信公众号今日也官宣介绍了该公司的大模型新项目 —— 文心一言(英文名 ERNIE Bot)。公告注释称: ①.百度在人工智能四层架构中,有全栈布局。包括底层的芯片、深度学习框架、大

2023-10-28

生成音乐 Meta 放大招:发布开源大语言模型 Llama 2,可免费商用 Meta 发布语音生成 AI 模型:Voicebox Meta 开源音乐生成模型 MusicGen Meta 开源大模型:支持 4000+ 语言识别,1100+ 种语音文本转换

2023-07-10

IoTOS-App v0.1.0 后端程序为 https://gitee.com/chinaiot/iotos   一款高效实用 IoTCard 管理 & 运营系统 - 移动端。 IoTOS 移动端;基于RuoYi-App 开发 适配国际化多语言 UI 使用 uView ,集成 J-IM(t-io 网络框架

2023-02-19

更新内容 增加ServerMonitor监控指标配置 同步更新腾讯云短信内容规则 文章和问答增加评论开关属性 修正视频记忆播放无效问题 升级composer包版本 优化Repo查询默认排序 优化管理后台细节 优化二维码输出 优化评

2022-08-09

酷瓜云课堂 更新内容 增加应用内命令行migrations 移除群组和微聊模块 kindeditor替换vditor markdown转html 系统介绍 酷瓜云课堂,依托腾讯云基础服务架构,采用C扩展框架Phalcon开发,GPL-2.0开源协议,致力开源网课系统,