快手文生图大模型可图宣布开源


在2024世界人工智能大会上,快手高级副总裁、主站业务与社区科学负责人盖坤宣布,快手文生图大模型可图(Kolors)正式开源。该模型基于数十亿图文对进行训练,支持256的上下文token数,支持中英双语,技术细节参考技术报告

地址:https://github.com/Kwai-Kolors/Kolors

可图大模型是由快手AI团队自研打造的文生图大模型,具备强大的图像生成能力,它基于大语言模型与跨模态模型实现精准的用户意图理解,可以支持古诗词等中文特色的内容理解与生成,并且基于用户反馈持续优化,图像生成效果更贴近大众艺术审美了,支持海量全球艺术风格的生成。

据悉,快手搭建了以快意语言大模型、推荐大模型、视觉生成大模型(可图、可灵)为核心的大模型矩阵。其中,推荐模型SIM参数规模已达到十万亿的参数规模,下一代推荐大模型架构ACT预估每天可为快手App带来4亿分钟的时长增长。


相關推薦

2024-08-15

!本周爆火的文生图模型 FLUX.1 系列,支持中文提示词的快手生图,还有 SenseVoice 语音识别,都在本版本得到支持。 图一、图二:由FLUX.1-dev生成 - 新增内置支持模型 📦   - flux.1-schnell 和 flux.1-dev 🌟   - llama-3.1-instruct 4

2024-10-16

智谱宣布开源文生图模型 CogView3 及 CogView3-Plus-3B。CogView3 以及 CogView3-Plus 模型均使用 Apache 2.0 协议,目前该系列模型的能力已上线「智谱清言」(chatglm.cn)。 CogView3-Plus-3B 的效果: CogView3 是一个基于级联扩散的 text2img 模型

2023-10-26

道,申请文心大模型4.0的开发权限。腾讯混元大模型开放文生图功能腾讯混元宣布开放文生图功能,利用强大的中文理解能力,根据关键词生成具有真实感和自然度的各种风格图片,已被180多个业务接入,将在广告、游戏、内容

2025-03-22

快手搜索官方宣布已全面接入DeepSeek R1的大模型能力,优化搜索效果与用户体验,未来也会持续探索智能搜索场景的商业化变现能力。 此前,快手已宣布可灵AI已全面接入DeepSeek-R1,在视频生成、图片生成等场景下,用户可通过D

2024-05-18

型负责人蒋杰透露称,将在今年三季度开源混元最核心的文生文模型。 蒋杰称,腾讯内部正在训练三种尺寸(S、M、L)的文生文模型供开源使用, S版主要部署在手机端,拥有3B参数量; M版主要部署在PC端,参数量为5B;

2024-05-18

团体洽谈以筹集资金。 The Information 昨日报道称,知名文生图模型公司Stability AI因为资金紧张,最近几周至少与一位潜在买家就出售问题进行了讨论。 据悉,在2024年第一季度,Stability AI的营收不到500万美元,亏损超过3000万美

2023-09-08

」是此前字节内部代号为 “Grace” 的 AI 项目,目前拥有文生文、文生图的功能。进入默认页,可以发现部分智能体聊天界面,包括 AI 机器人 “豆包”、英语老师 Elaine、全能写作助手、超爱聊天的小宁等。这些智能体可以为用

2024-10-22

于KolourPaint画图工具和VISION视觉大模型,开发实现了智能文生图功能。那么,当传统的画图应用遇上先进的AI文生图技术,会碰撞出怎样的火花呢? 01智能生成,创意无限 在openKylin 2.0版本中,画图工具利用先进的自然语言处理

2025-03-25

。 此次接入后,基于万相最新开源模型,LiblibAI推出了文生视频和图生视频功能。用户只需输入文本提示词,或者上传图片,就能快速生成10秒短视频。这一功能的实现,让创意转化为视频内容变得更加高效便捷,无论是用于短

2024-05-01

34 岁的老白在短视频应用快手的工作岌岌可危的第一个迹象,是其一位 35 岁同事被解雇。 “既震惊又焦虑,” 老白说,他使用昵称以免遭到前雇主的报复。这位开发人员距离 35 岁生日只有几个月,就被解雇了,成为公司内部

2025-03-21

动态性和稳定性,为创作者提供更为灵活的选择。 相比文生视频模型 Step-Video-T2V,此次开源的 Step-Video-TI2V 主要针对图生视频任务做了两大关键优化: 第一,引入图像条件,提高一致性 为了让模型更好地理解输入的图片,

2023-03-02

3.0”视觉预训练大模型EVA,视觉通用多任务模型Painter,文生图大模型AltDiffusion(多语言),文图表征预训练大模型(多语言)、EVA-CLIP(英文),阿拉伯语大模型ALM,百亿语言基础模型CPM3等。 目前,FlagAI 已经加入 Linux&

2024-07-05

讯飞星火,清华 ChatGLM等多个大语言模型。 支持 Suno 文生音乐 支持 MidJourney / Stable Diffusion AI 绘画集成,文生图,图生图,换脸,融图。开箱即用。 已集成支付宝支付功能,微信支付,支持多种会员套餐和点卡购买功能

2024-03-02

提供更多发展空间。 大语言模型ChatGPT的热潮还未退去,文生视频大模型Sora又惊艳亮相,推动通用人工智能技术的“车轮”滚滚向前。ChatGPT和Sora都证明,人工智能所孕育的颠覆性技术和前沿技术,有望成为新一轮科技革命与产