快手文生图大模型可图宣布开源

2024-07-07 發表於开源资讯

在2024世界人工智能大会上，快手高级副总裁、主站业务与社区科学负责人盖坤宣布，快手文生图大模型可图（Kolors）正式开源。该模型基于数十亿图文对进行训练，支持256的上下文token数，支持中英双语，技术细节参考技术报告。

地址：https://github.com/Kwai-Kolors/Kolors

可图大模型是由快手AI团队自研打造的文生图大模型，具备强大的图像生成能力，它基于大语言模型与跨模态模型实现精准的用户意图理解，可以支持古诗词等中文特色的内容理解与生成，并且基于用户反馈持续优化，图像生成效果更贴近大众艺术审美了，支持海量全球艺术风格的生成。

据悉，快手搭建了以快意语言大模型、推荐大模型、视觉生成大模型（可图、可灵）为核心的大模型矩阵。其中，推荐模型SIM参数规模已达到十万亿的参数规模，下一代推荐大模型架构ACT预估每天可为快手App带来4亿分钟的时长增长。

相關推薦

快手：可灵 AI 全系模型进入 2.0 时代

2025-04-16

令遵循、电影质感及艺术风格表现等方面显著提升。快手高级副总裁、社区科学线负责人盖坤透露，自去年6月发布以来，可灵AI已累计完成超20次迭代。截至目前，可灵AI全球用户规模突破2200万，过去的10个月里，其月活用

可灵 AI 上线可图 2.1 模型

2025-07-12

出让会员用户能够在7月17日之前免费体验，为用户提供了文生图、单图参考和多图参考等核心功能。可图2.1在理解复杂指令方面表现突出，可以准确捕捉提示词中的各种元素和逻辑关系。例如，当输入 “3D 微缩沙盘模型，展

Xinference 0.14.1发布：文生视频 CogVideoX 等新功能齐上阵！

2024-08-15

！本周爆火的文生图模型 FLUX.1 系列，支持中文提示词的快手生图，还有 SenseVoice 语音识别，都在本版本得到支持。图一、图二：由FLUX.1-dev生成 - 新增内置支持模型 📦 - flux.1-schnell 和 flux.1-dev 🌟 - llama-3.1-instruct 4

中国开源 AI 社区 7 月高亮时刻回顾

2025-08-05

、中国电信人工智能研究院（1个）、蚂蚁集团（4个）、快手（1个）、捏Ta（1个）、磐石（3个）、上海交通大学（1个）、腾讯（1个）、上海人工智能实验室（1个）、复旦大学（1个）。 1、阿里（9个）：编程模型Qwen3-Coder-30B-A3

快手开源"Auto Think"大模型，可根据问题自动调节思考深度

2025-06-05

快手 Kwaipilot 团队宣布开源 KwaiCoder-AutoThink-preview 自动思考大模型，针对近期深度思考大模型存在的“过度思考”问题进行了深入研究。团队不仅提出了一种全新的自动思考模型训练范式，还基于传统强化学习算法（GRPO），创

快手开源多模态大模型 Kwai Keye-VL

2025-06-28

快手宣布并开源其最新自研的多模态大语言模型 Kwai Keye-VL。根据介绍，Kwai Keye-VL 以 Qwen3-8B 语言模型为基础，引入了基于开源 SigLIP 初始化的 VisionEncoder，能够深度融合并处理文本、图像、视频等多模态信息，凭借其创新的自适

智谱开源新一代文生图模型 CogView3-Plus

2024-10-16

智谱宣布开源文生图模型 CogView3 及 CogView3-Plus-3B。CogView3 以及 CogView3-Plus 模型均使用 Apache 2.0 协议，目前该系列模型的能力已上线「智谱清言」（chatglm.cn）。 CogView3-Plus-3B 的效果： CogView3 是一个基于级联扩散的 text2img 模型

快手高级副总裁盖坤兼任可灵AI技术部负责人

2025-08-19

快手宣布高级副总裁盖坤兼任可灵 AI 技术部负责人，继续向 CEO 程一笑汇报，进一步强化可灵 AI 在快手战略中的地位。据了解，盖坤自 2020 年加入快手后，主导推荐算法、视频生成大模型等技术研发，并推动可灵 AI 成为全球

DeepSeek 使用率下降 50%

2025-05-16

真自拍」等热点玩法，实现了「病毒式」使用率增长；快手的视频生成模型「可灵」在发布 Kling-2.0-Master 后，用短短三周时间获得了 21% 的 Poe 视频生成占有率。 Poe 还在报告中提到，发送给 Poe 内的推理模型的消息文本份额

快手搜索已全面接入 DeepSeek R1

2025-03-22

快手搜索官方宣布已全面接入DeepSeek R1的大模型能力，优化搜索效果与用户体验，未来也会持续探索智能搜索场景的商业化变现能力。此前，快手已宣布可灵AI已全面接入DeepSeek-R1，在视频生成、图片生成等场景下，用户可通过D

AI视野：百度开放文心4.0开发权限申请；腾讯混元大模型开放文生图功能；谷歌AI应用禁止生成受限内容；Midjourney新网站上线测试版

2023-10-26

道，申请文心大模型4.0的开发权限。腾讯混元大模型开放文生图功能腾讯混元宣布开放文生图功能，利用强大的中文理解能力，根据关键词生成具有真实感和自然度的各种风格图片，已被180多个业务接入，将在广告、游戏、内容

腾讯混元文生文大模型将在三季度开源

2024-05-18

型负责人蒋杰透露称，将在今年三季度开源混元最核心的文生文模型。蒋杰称，腾讯内部正在训练三种尺寸（S、M、L）的文生文模型供开源使用， S版主要部署在手机端，拥有3B参数量； M版主要部署在PC端，参数量为5B；

快手开源 KuaiMod，多模态 AI 专治各种劣质内容

2025-05-10

快手推出了基于多模态大模型的创新方案 KuaiMod，旨在优化短视频平台生态并提升用户体验。 KuaiMod 的核心在于其对短视频内容的质量判别。传统的内容判别方法往往依赖于静态规则和人工标注，成本高且难以应对用户偏好的动

开源文生图模型 Stable Diffusion 开发商欠账 1 亿美元

2024-05-18

团体洽谈以筹集资金。 The Information 昨日报道称，知名文生图模型公司Stability AI因为资金紧张，最近几周至少与一位潜在买家就出售问题进行了讨论。据悉，在2024年第一季度，Stability AI的营收不到500万美元，亏损超过3000万美

熱門推薦