腾讯混元宣布正式推出并开源全新的多模态定制化视频生成工具 HunyuanCustom。HunyuanCustom 融合了文本、图像、音频、视频等多模态输入生视频的能力,是一款具备高度控制力和生成质量的智能视频创作工具。
HunyuanCustom 整体架构如下:
腾讯表示,Hunyuan Custom 模型能实现单主体视频生成、多主体视频生成、单主体视频配音、视频局部编辑等能力,其生成的视频与用户输入的参考主体能保持高度一致。
其中,单主体生成能力已经开源并在混元官网(https://hunyuan.tencent.com/)上线,用户可以在“模型广场-图生视频-参考生视频”中体验,其他能力将于 5 月内陆续对外开源。
相关链接
-
体验入口:https://hunyuan.tencent.com/modelSquare/home/play?modelId=192
-
项目官网:https://hunyuancustom.github.io/
-
代码开源:https://github.com/Tencent/HunyuanCustom
-
论文地址:https://arxiv.org/pdf/2505.04512