在2024世界人工智能大会上,快手高级副总裁、主站业务与社区科学负责人盖坤宣布,快手文生图大模型可图(Kolors)正式开源。该模型基于数十亿图文对进行训练,支持256的上下文token数,支持中英双语,技术细节参考技术报告。
地址:https://github.com/Kwai-Kolors/Kolors
可图大模型是由快手AI团队自研打造的文生图大模型,具备强大的图像生成能力,它基于大语言模型与跨模态模型实现精准的用户意图理解,可以支持古诗词等中文特色的内容理解与生成,并且基于用户反馈持续优化,图像生成效果更贴近大众艺术审美了,支持海量全球艺术风格的生成。
据悉,快手搭建了以快意语言大模型、推荐大模型、视觉生成大模型(可图、可灵)为核心的大模型矩阵。其中,推荐模型SIM参数规模已达到十万亿的参数规模,下一代推荐大模型架构ACT预估每天可为快手App带来4亿分钟的时长增长。