HiDream 智象未来团队宣布正式开源图像生成大模型 HiDream-I1 与交互编辑模型 HiDream-E1。
HiDream-I1 在权威榜单 Artificial Analysis 中 24 小时内登顶,成为首个跻身全球第一梯队的中国自研生成式 AI 模型,并在图像质量、语义理解、艺术表现三大维度刷新行业纪录,实现图像的多风格生成,涵盖动漫、肖像、科幻等场景。
目前,设计工具 Recraft 已集成 HiDream 模型,用户 3 步即可实现 “一键出图 + 智能编辑”。
HiDream-I1 已开源三个版本的模型,分别是:
其中 HiDream-I1-Full 是由 HiDream.ai 团队发布的开源图像生成基础模型,具备 170 亿参数,旨在实现高质量的图像生成。该模型采用 Diffusion Transformer(DiT)架构,支持多种风格的图像生成,包括写实、卡通、艺术等,适用于多种创作场景。
核心特性
-
卓越的图像质量:在多个基准测试中表现出色,HPS v2.1 平均得分为 33.82,优于 SDXL、DALL·E 3 等主流模型 。
-
强大的提示词理解能力:在 GenEval 和 DPG-Bench 等评测中,HiDream-I1 的表现优于其他开源模型,展示了其在理解和执行复杂提示词方面的能力。腾讯网+1阿里云开发者社区-云计算社区-阿里云+1
-
开源且商业友好:采用 MIT 许可证,允许用户在个人、科研和商业项目中自由使用生成的内容。
性能评估
在多个评测中,HiDream-I1 展示了其强大的性能:
-
DPG-Bench:在整体、实体、属性等多个维度上得分领先,展示了其在图像生成质量方面的优势。
-
GenEval:在单目标、双目标、计数、颜色等任务中表现优异,反映了其对提示词的准确理解和执行能力。
-
HPS v2.1:在动画、概念艺术、绘画、照片等风格的图像生成中,HiDream-I1 的得分均高于其他主流模型,展示了其多风格生成的能力。
HiDream-I1-Full 模型整体采用 MIT 协议开源,可自由商用,但部分依赖组件(如 LLaMA3 编码器)需遵守各自协议,商用前应留意其具体限制。