中国团队自研 AI 图像生成大模型 HiDream-I1 正式开源


HiDream 智象未来团队宣布正式开源图像生成大模型 HiDream-I1 与交互编辑模型 HiDream-E1。

HiDream-I1 在权威榜单 Artificial Analysis 中 24 小时内登顶,成为首个跻身全球第一梯队的中国自研生成式 AI 模型,并在图像质量、语义理解、艺术表现三大维度刷新行业纪录,实现图像的多风格生成,涵盖动漫、肖像、科幻等场景。

目前,设计工具 Recraft 已集成 HiDream 模型,用户 3 步即可实现 “一键出图 + 智能编辑”。

HiDream-I1  已开源三个版本的模型,分别是:

其中 HiDream-I1-Full 是由 HiDream.ai 团队发布的开源图像生成基础模型,具备 170 亿参数,旨在实现高质量的图像生成。该模型采用 Diffusion Transformer(DiT)架构,支持多种风格的图像生成,包括写实、卡通、艺术等,适用于多种创作场景。

核心特性

  • 卓越的图像质量:在多个基准测试中表现出色,HPS v2.1 平均得分为 33.82,优于 SDXL、DALL·E 3 等主流模型 。

  • 强大的提示词理解能力:在 GenEval 和 DPG-Bench 等评测中,HiDream-I1 的表现优于其他开源模型,展示了其在理解和执行复杂提示词方面的能力。腾讯网+1阿里云开发者社区-云计算社区-阿里云+1

  • 开源且商业友好:采用 MIT 许可证,允许用户在个人、科研和商业项目中自由使用生成的内容。

性能评估

在多个评测中,HiDream-I1 展示了其强大的性能:

  • DPG-Bench:在整体、实体、属性等多个维度上得分领先,展示了其在图像生成质量方面的优势。

  • GenEval:在单目标、双目标、计数、颜色等任务中表现优异,反映了其对提示词的准确理解和执行能力。

  • HPS v2.1:在动画、概念艺术、绘画、照片等风格的图像生成中,HiDream-I1 的得分均高于其他主流模型,展示了其多风格生成的能力。

HiDream-I1-Full 模型整体采用 MIT 协议开源,可自由商用,但部分依赖组件(如 LLaMA3 编码器)需遵守各自协议,商用前应留意其具体限制。


相關推薦

2023-11-06

信AI”评估,并被评选为人工智能实验室副组长单位。经中国信通院评估,昆仑万维天工大模型符合AIIA/PG 0071-2023、AIIA/PG 0072-2023评估标准,模型开发、以及模型能力均达到了“4+级”。 10月30日,昆仑万维开源百亿级大语言模型

2023-06-17

构、开源社区等共同发布“共建人工智能框架生态,繁荣中国人工智能产业”联合倡议,倡议通过政产学研用的共同努力,支撑中国人工智能框架生态走向新高度,推进中国人工智能产业新发展。 《共建人工智能框架生态倡

2024-07-07

:https://github.com/Kwai-Kolors/Kolors 可图大模型是由快手AI团队自研打造的文生图大模型,具备强大的图像生成能力,它基于大语言模型与跨模态模型实现精准的用户意图理解,可以支持古诗词等中文特色的内容理解与生成,并且

2024-01-13

中国电信宣布将自研星辰 AI 大型模型全面开源,公开其底层代码、算法逻辑及其预制的各种基础大模型、开发模块、训练工具等核心产品能力。 用户既可以直接调用大模型,也可以根据自身业务需求对大模型进行微调或个性化

2024-08-29

将有一半销量将来自海外,从欧洲起步,以科技为导向将中国的智能化带往全球。”

2025-04-08

需深度思考的问题。 AI推理时代即将到来? 今年年初,中国AI公司DeepSeek模型的横空出世在AI领域掀起巨浪,R1模型因其高效推理能力和低成本训练受到全球关注,也对英伟达等芯片企业形成了前所未有的冲击。 英伟达公司年

2024-06-27

领域开展交叉创新研究,相关学术成果发表于Nature主刊,中国科学,NeurIPS,CVPR,ICCV,AAAI,ACM MM,ICRA以及IROS等国内外顶级期刊与学术会议,并积极开展产学研合作创新,助力解决产业发展中的技术难点、痛点问题。 经过调

2023-07-08

【中国,东莞,2023年7月7日】华为开发者大会2023(Cloud)7月7日在中国东莞正式揭开帷幕,并同时在全球10余个国家、中国30多个城市设有分会场,邀请全球开发者共聚一堂,就AI浪潮之下的产业新机会和技术新实践开展交流分享

2025-03-27

全球首款音乐推理大模型,性能超越Suno、模型登顶SOTA,中国科技创新再次在AI音乐领域领跑全球。” 2024年4月,昆仑万维发布了第一代音乐生成模型:Mureka V1(SkyMusic)。Mureka V6是当前Mureka的基座模型,支持纯音乐生成,还支

2024-08-16

展开源技术的应用领域,推动开源技术的创新发展。 中国电子信息产业集团有限公司战略合作部副主任吕亚洲认为,当前,集众智、采众长的开源模式已成为全球计算技术和产业创新的主导。我国是全球开源生态的重要参与

2023-06-22

根据《科创板日报》的独家消息,蚂蚁集团技术研发团队正在自研语言和多模态大模型——内部命名为“贞仪”,该项目获得了蚂蚁集团管理层高度重视,已启动数月。 多模态大模型指的是将文本、图像、视频、音频等多模态

2024-08-16

2022年,由开放原子开源基金会旗下的欧拉社区所代表的中国服务器操作系统根社区,以及由统信软件主导运营的deepin深度社区所代表的中国桌面操作系统根社区先后投入建设。 所谓Linux操作系统根社区,是从Linux kernel和其他开

2024-10-31

型与3D大模型的AI短剧平台SkyReels推出。AI游戏方面,公司自研AI游戏《Club Koala》、《Project G7》研发测试工作进展顺利。 AI社交方面,Linky持续迭代优化大语言模型,优化模型算法和用户交互,在对话的流畅性和角色互动的深度上

2024-09-28

在2024年中国国际智能传播论坛上,哔哩哔哩(简称B站)董事长兼CEO陈睿宣布,该公司自研的大语言模型“index”已成功上线,并应用于AI字幕功能。 陈睿表示,AI已成为年轻人在B站上最为关注的内容之一,也是增长最快的科