腾讯混元开源 Hunyuan 3D 2.0 家族新模型


腾讯混元日前宣布正式开源基于Hunyuan 3D 2.0技术框架的5款三维生成模型,进一步丰富 3D AIGC 社区。

本次开源的Turbo加速系列、多视图推理模块及轻量级mini模型,均基于Hunyuan 3D 2.0模型,组成了包含6大模型的Hunyuan 3D 2.0 家族。

  • 轻量级模型 Hunyuan3D-2mini:通过模型剪枝大幅度减少模型参数,与 1 月份开源版本相比参数量从 11 亿下降到 6 亿,并且具有更高的隐空间压缩率。该轻量版模型为低算力设备提供了高效解决方案,够大幅降低了 GPU 显存的占用,因此显著降低了硬件需求,最低支持 4060等消费级显卡。
  • 多视图版本模型 Hunyuan3D-2mv:支持多视图输入信息(2 到 4 张图片),能够更精准地捕捉细节,更加符合原画师、设计师用户生产习惯,大幅降低游戏制作、3D 用户生成内容创作等场景的制作成本。
  • Turbo 系列模型:基于FlashVDM的3D原生模型加速框架,分别对DiT模型和VAE模型进行优化,大幅减小几何模型生成耗时,实现了数十倍的生成速度提升,将高精度模型的生成的时间压缩至秒级。通过将该加速框架应用到轻量的 mini 模型上,甚至最快可以做到 0.5 秒内生成白模。此外,通过加速后的模型可以在 Apple M1 Pro 等芯片上进行部署,速度与标准版在显卡上部署的速度相当。

通过对Hunyuan3D-2 加速版模型(Turbo模型)和标准版(Hunyuan3D-2)进行用户双盲对比测试。结果显示,在5步迭代条件下,87.3%的生成结果对比组中,测试参与者无法从视觉上区分Turbo模型与标准版的输出差异。当迭代步数提升至8步时,无法区分差异的结果对比组比例上升至90.2%。


相關推薦

2023-09-27

产模型:通义千问,文心一言,讯飞星火,商汤日日新,腾讯混元大语言模型 开源大模型:Llama2 ,ChatGLM2 ,AquilaChat 7B ,Bloomz 7B 等,后续还将开放更多 文生图、图生图、超分辨率、黑白图片上色等功能,集成 Stable Diffusion

2025-03-22

碰到体量很大、需要做复杂计算的表格时,可以切换到 Hunyuan,并关闭深度思考。这样,快思考模型混元Turbo S 就可以用代码的方式进行快速分析。 目前,腾讯元宝不仅支持本地上传表格,还支持从微信和腾讯文档直接导入。无

2024-05-18

5月17日上午,在腾讯生成式AI产业应用峰会上,腾讯副总裁、腾讯混元大模型负责人蒋杰透露称,将在今年三季度开源混元最核心的文生文模型。 蒋杰称,腾讯内部正在训练三种尺寸(S、M、L)的文生文模型供开源使用, S

2023-08-05

根据多家媒体的报道,腾讯自研的“腾讯混元大模型”已经进入应用内测阶段。腾讯员工近期收到了内部邮件邀请,可以通过网页或者小程序体验混元大模型,腾讯内部多个业务也已经接入混元大模型进行测试。 腾讯表示,从

2023-09-07

微信今天宣布,现已上线「腾讯混元助手」小程序。小程序页面显示,腾讯混元助手目前仅向受邀用户开放。 可以看到,腾讯的 AI 大模型被命名为“腾讯混元大模型”,「腾讯混元助手」则是基于该大模型的多模态对话 Bot

2025-03-21

腾讯混元通过官方公众号宣布,全新的推理模型 T1 将于本周五(北京时间 3 月 21 日 23 时)正式发布。 与此同时,腾讯宣布,混元大模型首次登上 Chatbot Arena 榜单,跻身全球 Top 15。用户在该平台上以匿名方式与多个模型互动

2023-10-26

tudio 星河社区官方频道,申请文心大模型4.0的开发权限。腾讯混元大模型开放文生图功能腾讯混元宣布开放文生图功能,利用强大的中文理解能力,根据关键词生成具有真实感和自然度的各种风格图片,已被180多个业务接入,将

2025-03-21

腾讯开源发文宣布,腾讯混元首次上榜海外权威大模型竞技场 Chatbot Arena 最新排名,跻身全球 Top 15。 Chatbot Arena 发起方 LMSYS Org (加州大学伯克利分校等机构支持的非营利组织)通过官方X账号对腾讯混元的加入表示欢迎。 “

2023-11-08

产模型:通义千问,文心一言,讯飞星火,商汤日日新,腾讯混元,百川 53B ,360 智脑 开源模型:Llama2 ,ChatGLM2 ,AquilaChat 7B ,Bloomz 7B 等,后续还将开放更多 文生图、图生图、超分辨率、黑白图片上色等功能,集成 Stable Diffu

2025-03-20

3月19日,腾讯2024年第四季度及全年业绩新闻发布上,腾讯总裁刘炽平透露,从2月到3月,元宝的日活跃用户(DAU )增长了20倍,成为了中国DAU排名第三的AI原生移动应用。 另外,腾讯董事会主席兼首席执行官马化腾透露,腾讯

2025-04-03

腾讯元宝宣布再次更新,其识图功能进一步拓展,支持一次性上传10张图片,非常适用于那些需要理清结构、提炼重点、生成内容的情况。 “这项功能结合了混元的多模态理解能力,也是元宝双模型能力的体现。现在,你只要

2025-03-21

放一堆好用好玩的功能。 6. 图片生成功能藏太深,要选hunyuan模型,然后把底部的深度思考以及联网模式,都取消,就可以按此前一样,画图了。 7. 希望可以增加收藏和笔记等分类功能,并且和微信搜索 ima打通 8. 腾讯元宝

2023-04-26

F3D(发音为/fɛd/)是极速且简约的开源 3D 模型查看器。它支持多种文件格式,从数字内容到科学数据集(包括 glTF、STL、STEP、PLY、OBJ、FBX、Alembic),可以显示动画并支持缩略图,以及许多渲染和纹理选项,包括基于物理的实时

2024-07-18

法国人工智能初创公司 Mistral 以其强大的开源人工智能模型而闻名。今天,该公司在其不断壮大的大型语言模型 (LLM) 家族中推出了两个新产品:一个是基于数学的模型,另一个是面向程序员和开发人员的代码生成模型,