腾讯混元日前宣布正式开源基于Hunyuan 3D 2.0技术框架的5款三维生成模型,进一步丰富 3D AIGC 社区。
本次开源的Turbo加速系列、多视图推理模块及轻量级mini模型,均基于Hunyuan 3D 2.0模型,组成了包含6大模型的Hunyuan 3D 2.0 家族。
- 轻量级模型 Hunyuan3D-2mini:通过模型剪枝大幅度减少模型参数,与 1 月份开源版本相比参数量从 11 亿下降到 6 亿,并且具有更高的隐空间压缩率。该轻量版模型为低算力设备提供了高效解决方案,够大幅降低了 GPU 显存的占用,因此显著降低了硬件需求,最低支持 4060等消费级显卡。
- 多视图版本模型 Hunyuan3D-2mv:支持多视图输入信息(2 到 4 张图片),能够更精准地捕捉细节,更加符合原画师、设计师用户生产习惯,大幅降低游戏制作、3D 用户生成内容创作等场景的制作成本。
- Turbo 系列模型:基于FlashVDM的3D原生模型加速框架,分别对DiT模型和VAE模型进行优化,大幅减小几何模型生成耗时,实现了数十倍的生成速度提升,将高精度模型的生成的时间压缩至秒级。通过将该加速框架应用到轻量的 mini 模型上,甚至最快可以做到 0.5 秒内生成白模。此外,通过加速后的模型可以在 Apple M1 Pro 等芯片上进行部署,速度与标准版在显卡上部署的速度相当。
通过对Hunyuan3D-2 加速版模型(Turbo模型)和标准版(Hunyuan3D-2)进行用户双盲对比测试。结果显示,在5步迭代条件下,87.3%的生成结果对比组中,测试参与者无法从视觉上区分Turbo模型与标准版的输出差异。当迭代步数提升至8步时,无法区分差异的结果对比组比例上升至90.2%。