智谱 AI 官宣:ChatGLM2-6B 可免费商用


中英双语大模型 ChatGLM2-6B 开发团队——智谱AI&清华KEG昨晚宣布即日起 ChatGLM-6B 和 ChatGLM2-6B 权重对学术研究完全开放,并且在完成企业登记获得授权后,允许免费商业使用

ChatGLM2-6B 是开源中英双语对话模型 ChatGLM-6B 的第二代版本,在保留了初代模型对话流畅、部署门槛较低等众多优秀特性的基础之上,ChatGLM2-6B 引入了如下新特性:

  • 更强大的性能:基于 ChatGLM 初代模型的开发经验,全面升级了 ChatGLM2-6B 的基座模型。ChatGLM2-6B 使用了 GLM 的混合目标函数,经过了 1.4T 中英标识符的预训练与人类偏好对齐训练,评测结果显示,相比于初代模型,ChatGLM2-6B 在 MMLU(+23%)、CEval(+33%)、GSM8K(+571%) 、BBH(+60%)等数据集上的性能取得了大幅度的提升,在同尺寸开源模型中具有较强的竞争力。
  • 更长的上下文:基于 FlashAttention 技术,项目团队将基座模型的上下文长度(Context Length)由 ChatGLM-6B 的 2K 扩展到了 32K,并在对话阶段使用 8K 的上下文长度训练,允许更多轮次的对话。但当前版本的 ChatGLM2-6B 对单轮超长文档的理解能力有限,我们会在后续迭代升级中着重进行优化。
  • 更高效的推理:基于 Multi-Query Attention 技术,ChatGLM2-6B 有更高效的推理速度和更低的显存占用:在官方的模型实现下,推理速度相比初代提升了 42%,INT4 量化下,6G 显存支持的对话长度由 1K 提升到了 8K。

示例对比

相比于初代模型,ChatGLM2-6B 多个维度的能力都取得了提升,以下是一些对比示例。

数理逻辑

知识推理

长文档理解


相關推薦

2023-07-22

作智谱 AI,共研千亿级大语言模型 360GLM 智谱 AI 官宣:ChatGLM2-6B 可免费商用

2023-06-29

即刻体验百川-7B 模型: https://hf.co/spaces/ysharma/baichuan-7B ChatGLM2-6B 重磅发布,荣登 Hugging Face 趋势榜单之首! ChatGLM2-6B 是开源中英双语对话模型 ChatGLM-6B 的第二代版本,在保留了初代模型对话流畅、部署门槛较低等众多优秀特

2023-07-27

eGeeX2 是多语言代码生成模型 CodeGeeX 的第二代模型,基于 ChatGLM2 架构注入代码实现。 我们希望每一位程序员,都能在自己机器上跑上一个自己的编程助手。为实现这一目标,我们现将「代码生成模型 CodeGeeX2-6B」开源。同时我

2025-04-18

报》报道称,北京市人工智能产业投资基金追加投资北京智谱华章科技股份有限公司(以下简称智谱)2 亿人民币。 北京市人工智能产业投资基金表示,智谱是基金成立以来投资的第一家 AI 大模型企业,也是目前成长最快的企

2025-07-12

智谱悄然上线了一项全新的 PPT 生成功能 ——AI Slides。该功能借助最新的 GLM-Experimental 模型,能够根据用户提供的研究主题或文档,快速生成高质量的 PPT 展示。这一新功能目前可以免费使用,并且没有使用限制。 在使用 AI Sl

2023-09-27

汤日日新,腾讯混元大语言模型 开源大模型:Llama2 ,ChatGLM2 ,AquilaChat 7B ,Bloomz 7B 等,后续还将开放更多 文生图、图生图、超分辨率、黑白图片上色等功能,集成 Stable Diffusion 模型,支持 SDXL 1.0 今天最新版本的 1.0.5 发布

2025-04-01

智谱正式发布了「AutoGLM沉思」,这一全新智能体不仅具备深度研究能力(Deep Research),还能实现实际操作(Operator),真正推动AI Agent进入「边想边干」的阶段。 据介绍,「AutoGLM沉思」的技术演进路径包括:GLM-4基座模型 →

2025-05-22

规收集使用个人信息的情况,其中涉及不少 AI 应用,如智谱清言、Kimi等。 具体通报如下: 1、未以结构化清单的方式逐一列出收集、使用个人信息规则。涉及 12 款移动应用如下: 《智慧 AI 聊天》(版本 1.4.0)、《虚拟

2025-08-02

在 8B 量级里非常能打。 GLM-4-9B / GLM-4-9B-Chat 来自智谱的通用语言模型,性能扎实,特别适合中文语境下的多轮问答和对话场景。 DeepSeek-R1-Distill-Qwen 系列(14B / 7B / 1.5B) DeepSeek-R1 模型的轻量蒸馏版,覆盖大中小三

2025-07-29

据多方媒体报道,智谱将于今晚(7月28日) 正式发布其最新开源大模型 GLM-4.5 系列,该系列采用全新的混合专家(MoE)架构,定位为多模态可扩展大模型,具备高吞吐推理、结构化工具调用、可解释推理追踪、分布式负载均衡

2025-03-27

,极大降低服务器资源占用,同时深度融合各种大模型如智谱AI 、DeepSeek 等,开放 linux 一键部署。 它可以提供标准的文本翻译API,一方面可以配合 translate.js 进行使用,另一方面如果你需要文本翻译,完全可以使用它,

2025-07-17

智谱清言宣布旗下清影 AI 视频生成功能全面升级。 官方介绍,相比前一版本,升级后的清影 AI 视频可生成多样的场景风格视频,画面主体更稳定,表现更清晰自然。 具体亮点如下: 极致的画面表现:画面清晰度更加,

2025-06-19

ThingsPanel发布AI小智开源支持,并免费商用。给行业带来诸多独特价值。   ThingsPanel是一个开源的物联网平台,支持广泛的协议和设备接入能力,具备场景联动能力。 AI小智是一个基于ESP32的语音设备,自带AI语音交互

2024-10-15

基于大模型 LLM && RAG 的智能客服 支持Ollama 智谱AI AI助手 更适合团队使用,一人配置,多人使用。完美权限控制,即可私用,也可公用 在线客服:跟客户聊 支持多渠道: 平台渠道:Web/H5/React/Android/iOS/U