CodeGeeX2-6B 开源,最低 6GB 显存,性能优于 StarCoder


GLM 技术团队宣布开源最新的代码模型 CodeGeeX2-6B。CodeGeeX2 是多语言代码生成模型 CodeGeeX 的第二代模型,基于 ChatGLM2 架构注入代码实现。

我们希望每一位程序员,都能在自己机器上跑上一个自己的编程助手。为实现这一目标,我们现将「代码生成模型 CodeGeeX2-6B」开源。同时我们也将对该模型持续进行迭代升级,以提供更加强大的代码辅助能力。

公告称,得益于 ChatGLM2 的更优性能,CodeGeeX2-6B 在多项指标上取得了较大的性能提升。与 150 亿参数的 StarCoder-15B 相比,CodeGeeX2-6B 凭借 60 亿参数便具备了近 10% 的优势。

更多特性包括:

  • 更强大的代码能力:基于 ChatGLM2-6B 基座语言模型,CodeGeeX2-6B 进一步经过了 600B 代码数据预训练,相比一代模型,在代码能力上全面提升,HumanEval-X 评测集的六种编程语言均大幅提升 (Python +57%, C++ +71%, Java +54%, JavaScript +83%, Go +56%, Rust +321%),在Python上达到 35.9% 的 Pass@1 一次通过率,超越规模更大的 StarCoder-15B。
  • 更优秀的模型特性:继承 ChatGLM2-6B 模型特性,CodeGeeX2-6B 更好支持中英文输入,支持最大 8192 序列长度,推理速度较一代 CodeGeeX-13B 大幅提升,量化后仅需6GB显存即可运行,支持轻量级本地化部署。
  • 更全面的AI编程助手:CodeGeeX插件(VS Code, Jetbrains)后端升级,支持超过100种编程语言,新增上下文补全、跨文件补全等实用功能。结合 Ask CodeGeeX 交互式AI编程助手,支持中英文对话解决各种编程问题,包括且不限于代码解释、代码翻译、代码纠错、文档生成等,帮助程序员更高效开发。
  • 更开放的协议:CodeGeeX2-6B 权重对学术研究完全开放。

代码能力评测

CodeGeeX2 作为一个多语言代码生成基座模型,代码能力较上一代大幅提升,以下是在 HumanEval,HumanEval-X, DS1000 基准上的评测结果(评价指标 Pass@k 定义与论文中一致):

量化推理性能

CodeGeeX2 与上一代相比,对部署更加友好。得益于使用 Multi-Query Attention 和 Flash Attention,推理速度更快,且量化后仅需6GB显存即可运行:

量化

推理


相關推薦

2023-05-06

ng Face 日前联合 ServiceNow 发布了一个免费的大型语言模型 StarCoder(150 亿参数),该模型经过训练主要用途是可以生成代码,目的是为了对抗 GitHub Copilot 和亚马逊 CodeWhisperer 等基于 AI 的编程工具。 目前像是 GitHub Copilot 这样的

2023-06-15

LT 还提供了灵活的分布式训练部署以满足不同的需求。 开源地址:https://github.com/alibaba/graphlearn-for-pytorch 文档地址:https://graphlearn-torch.readthedocs.io/en/latest/index.html 背景介绍 图神经网络作为一种图数据上表示学习的方法已

2023-07-16

业登记获得授权后,允许免费商业使用。 ChatGLM2-6B 是开源中英双语对话模型 ChatGLM-6B 的第二代版本,在保留了初代模型对话流畅、部署门槛较低等众多优秀特性的基础之上,ChatGLM2-6B 引入了如下新特性: 更强大的性能:基

2023-02-25

Mesa 23 的亮点包括: 支持 Radeon Memory Visualizer(RMV,显存可视化工具) RADV 光线追踪优化 英特尔 Arc Graphics DG2 / Alchemist 的持续改进 对 NVIDIA GeForce RTX 30 "Ampere" GPU 的初始 Nouveau 3D 支持 Zink OpenGL-on-Vulkan 驱动的持续改进

2023-04-25

地产生一定的影响。为了应对以上问题,PAI 团队推出并开源了TePDist(Tensor Program Distributed System),它通过在HLO上做分布式策略搜索,实现与用户模型语言解耦。并且在保持通用性的同时,在可接受的策略搜索时间内,追求高性

2023-02-03

中提到的“安全”编程语言在重要应用程序中实际上并不优于 C++。 Bjarne 指出,NSA 的这一判定忽略了 C/C++ 三十多年来的进步;且许多 C++ 的用例也停留在遥远的过去而忽视了改进,其中就包括极大地提高安全性的方法。

2023-08-27

提高软件开发效率。 据介绍,SafeCoder 是 HuggingFace 基于StarCoder 模型开发的编程辅助工具,针对企业自托管使用进行了优化,具有高效的推理、适应性和「合乎伦理」的数据源,精通 80 多种编程语言。支持通过与 Hugging Face 的协

2022-09-17

览器基准(分数越低越好): Blender: Blender 是一个开源的 3D 创作和建模软件项目。这个测试是 Blender 的 Cycles 基准测试(分数越低越好): Appleseed Appleseed 是一个开源的生产型渲染器,专注于基于物理的全局光照渲染

2023-11-09

腾讯开源了一个基于 RUST 语言开发的 QUIC 协议库 - TQUIC,旨在打造一个稳定、快速、高性能并具有广泛技术影响力的传输协议库。 “由于QUIC所具备的广泛性、长期性、创新性特点,我们开源了自研的TQUIC协议库,也希望借TQU

2022-12-10

Blender 是一个免费和开源的 3D 计算机图形软件工具集,用于创建动画电影、视觉效果、艺术、3D 打印模型、交互式 3D 应用、VR 和计算机游戏。随着 Blender 3.4 的发布,Blender 开发人员开始讨论提高 Blender 对 CPU 的要求,以便这款开

2023-06-29

加高效和便捷,现在已经有两个采用了 MQA 的语言模型: StarCoder 14B 和 Falcon 7B/40B。 查看论文: https://hf.co/papers/1911.02150 开源生态压轴出场 baichuan-7B: 免费可商用大语言模型 baichuan-7B 是由百川智能开发的一个开源的大规模预训

2024-01-03

会收到报告说用户创建的 issue 会被标记为垃圾邮件。 开源已经成为GitHub的代名词。 当前大部分开发都是在修复 issue,如果所有代码都在同一个平台上,那么跟踪交错 issue 就更容易了。 社区虽然提出了两个反对迁移的

2023-10-21

【源创会预告】1024 程序员节(的前两天),相约开源PHP办公室,我们一起聊 AI!>>> AI 编程语言 Mojo🔥 推出了支持 Mac 平台的版本,其创始人 Chris Lattner 称 Mojo + Apple Silicon 是强强联合,强上加强。 Mojo🔥 是 Modular AI 公

2023-08-26

创会」北京站,聊聊 AI 大模型与底层技术 >>> Meta 刚刚开源了号称是编程领域“最先进的大语言模型”——Code Llama,可根据代码和自然语言提示生成代码和有关代码的自然语言,支持多种主流编程语言,包括 Python、C++、Java、PH