昆仑万维开源「天工」Skywork-13B 系列大模型，0 门槛商用

2023-10-31 發表於开源资讯

昆仑万维宣布开源百亿级大语言模型「天工」Skywork-13B系列，并配套开源了600GB、150B Tokens的超大高质量开源中文数据集。昆仑万维「天工」Skywork-13B系列目前包括130亿参数的两大模型：Skywork-13B-Base模型、Skywork-13B-Math模型。

除模型开源外，Skywork-13B系列大模型还将开源600GB、150B Tokens的高质量中文语料数据集Skypile/Chinese-Web-Text-150B。公告称，这是目前最大的开源中文数据集之一。同时，昆仑万维「天工」Skywork-13B系列大模型即将全面开放商用；开发者无需申请，即可商用。

“此次Skywork-13B系列大模型将全面开放商用许可，用户在下载模型并同意并遵守《Skywork模型社区许可协议》后，无需再次申请授权即可将大模型进行商业用途。希望用户能够更便捷地探索Skywork-13B系列大模型技术能力，探索在不同场景下的商业化应用。”

Skywork-13B-Base模型

Skywork-13B-Base模型是Skywork-13B的基础模型，其经由3.2万亿个多语言高质量数据训练，在CEVAL、CMMLU、MMLUGSM8K等评测与基准测试上都展现了同等规模模型的最佳效果。

Skywork-13B-Math模型

Skywork-13B-Math模型经过专门的数学能力强化训练，在GSM8K等数据集上取得了同等规模模型的最佳效果。

Skypile/Chinese-Web-Text-150B数据集

该数据集是根据昆仑天工团队方面经过精心过滤的数据处理流程从中文网页中筛选出的高质量数据。本次开源的数据集大小约为600GB，总token数量约为150B，目前开源最大的中文数据集之一。

一些评测结果如下所示：

更多详情可查看官方公告。

昆仑万维开源「天工」Skywork-13B 系列大模型，0 门槛商用

相關推薦

昆仑万维「天工」大模型正式向全社会开放

昆仑万维发布「天工 SkyAgents」平台，零代码打造 AI 智能体

AI 专区上新啦！豆包、通义、360 AI、天工 AI、澜舟智库等入驻麒麟软件商店

昆仑万维 Q3 报告：实现经营性现金流 7.6 亿

昆仑万维 2024 年前三季度营收 38.3 亿

昆仑万维开源第二代奖励模型 Skywork-Reward-V2 系列

昆仑万维开源 Skywork-R1V 3.0

昆仑万维发布全球首款音乐推理大模型 Mureka O1

中国开源 AI 社区 7 月高亮时刻回顾

昆仑万维天工大模型登顶多模态榜单

昆仑万维发布 AI 短剧平台 SkyReels

蚂蚁集团百灵大模型通过备案，采用 Transfromer 架构

昆仑万维正式上线音乐模型 Mureka V7

昆仑万维旗下通用 Agent 产品 Skywork.ai 限时免费