Hugging Face 发布 AI 编程模型,对抗 GitHub Copilot


Hugging Face 日前联合 ServiceNow 发布了一个免费的大型语言模型 StarCoder(150 亿参数),该模型经过训练主要用途是可以生成代码,目的是为了对抗 GitHub Copilot 和亚马逊 CodeWhisperer 等基于 AI 的编程工具。

目前像是 GitHub Copilot 这样的 AI 编程工具都是偏商业化的产品,开发者需要付费订阅才能使用,而 StarCoder 可以让任何人(包括企业)免费使用。

AI 编程工具面临的另一个问题是,开发 AI 工具的这些科技公司通常都会使用网上公开的源代码来训练 AI,但这些数据集并没有获得授权,产生的代码也面临着法律、道德,以及代码归属等问题。比如 GitHub 现在就面临 Copilot 的集体诉讼。

为了避免这样的问题,StarCoder 则是在这两家公司获得授权的源代码上进行的训练,旨在以开放和负责任的方式为代码创建最先进的人工智能系统,授权的源代码涵盖了 80 种编程语言。

为了训练这样的模型,Hugging Face 使用了一个由 512 个 Nvidia V100 GPU 组成的内部计算集群来训练 StarCoder。

StarCoder 并不是严格意义上的开源 LLM 模型,它是在 OpenRAIL-M 许可下发布的,其中包括适用于修改模型和使用模型的限制,以及对分发恶意代码的限制。StarCoder 相关的支持代码目前已发布在 GitHub 上。


相關推薦

2023-08-27

26 日「源创会」北京站,聊聊 AI 大模型与底层技术 >>> HuggingFace 宣布推出代码助手 SafeCoder,帮助企业提高软件开发效率。 据介绍,SafeCoder 是 HuggingFace 基于StarCoder 模型开发的编程辅助工具,针对企业自托管使用进行了优化,

2022-07-16

的语言模型。 该项目始于去年,由人工智能初创公司 Hugging Face Inc.(最近融资了 1 亿美元)与法国研究机构 CNRS 和 GENCI 合作,他们共同成立了一个名为 BigScience 的研究小组来领导 Bloom 的开发。该项目汇集了 70 多个国家/地区

2025-03-22

后台,同时利用后台模型加载功能安装攻击者提前上传在Hugging Face的投毒模型文件,以便利用模型加载时的pickle反序列化逻辑,控制受害者机器,进一步渗透目标内网。 本次事件攻击者主要利用了ComfyUI 控制台无身份鉴权的配

2023-08-09

PyTorch 基金会宣布 Hugging Face 已加入为首要成员。与此同时,Hugging Face 开源负责人 Lysandre Debut 也成为了 PyTorch 基金会治理委员会的一员。 Hugging Face 是一个致力于降低机器学习和深度学习入门门槛的社区和公司,其模型

2023-10-24

一起寻宝 AI 时代 根据 Yahoo 新闻的报道,人工智能公司 Hugging Face 发言人在周五的一封电子邮件中写道: 中国的人工智能社区非常出色,我们希望他们能更好地访问 HF,但目前我们对于政府的法规无能为力。 The Chinese AI

2025-05-17

Hugging Face 宣布联合多家机构推动将transformers库作为模型架构标准,提升 AI 生态兼容性。 Hugging Face 表示正与 vLLM、LlamaCPP、SGLang、Mlx、Qwen、Glm、Unsloth、Axoloth、Deepspeed、IBM、Gemma、Llama、Deepseek、Microsoft、Nvidia、InternLM、Llava

2023-08-24

科技媒体 The Information 的报道,开源模型库公司 Hugging Face 正进行一轮新的融资,本轮融资由 Salesforce 旗下投资机构 Salesforce Ventures 领投,Salesforce CEO Marc Benioff 在推特证实了这一消息。Hugging Face 此次融资预计将筹集约

2025-04-30

像编辑模型 Step1X-Edit,上线次日就在海外开源社区平台 Hugging Face 登上 Spaces 趋势热榜,该榜单反映了模型实际应用价值的受欢迎程度。 Step1X-Edit 提供强大的改图能力,可以帮用户完成日常工作和生活中最高频的 11 类图像编辑

2025-05-10

Hugging Face 推出了免费云端 AI 智能体工具 Open Computer Agent,支持用户通过文本指令,远程操控基于 Linux 的虚拟计算机,使用 Firefox 等应用。 https://huggingface.co/spaces/smolagents/computer-agent 据介绍,Open Computer Agent 工具集成 smolagents

2023-06-29

每一周,我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新,包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等,我们将其称之为「Hugging News」,本期 Hugging News 有哪些有趣的

2025-05-28

南京大学Websoft研究团队构建了HuggingKG,这是一个基于Hugging Face社区的大型知识图谱,以及配套的多任务基准测试HuggingBench。 这两项资源的推出,将为开源资源的推荐、分类和溯源带来全新的解决方案。两项资源均已在Hugging Face

2025-05-16

,微软难以控制。 这一事件也引发了开源圈强烈不满。Hugging Face CEO Clément Delangue 公开批评微软的下架行为“破坏了数十个开源项目”,强调 WizardLM 模型每月下载量曾超过十万次,对生态影响巨大。 WizardLM 团队加入之际,腾

2023-08-05

IBM 宣布在 Hugging Face 上开源其 watsonx.ai 地理空间基础模型 -- 基于美国国家航空航天局 (NASA) 的卫星数据构建。这将是 Hugging Face 上最大的地理空间基础模型,也是首个与 NASA 合作构建的开源 AI 基础模型。 公告指出,作为与 NASA

2025-05-31

AI 开发平台 Hugging Face 发布了 HopeJR 和 Reachy Mini 两款开源人形机器人。 HopeJR 是全尺寸人形机器人,具备 66 个驱动自由度(即 66 个独立动作),包括行走和手臂运动能力。Reachy Mini 则是桌面版机器人