字节跳动发布图像编辑模型 SeedEdit 3.0


字节跳动 Seed 团队宣布正式发布了图像编辑模型SeedEdit3.0,技术报告对外公开,模型同步在即梦网页端开启测试,豆包 App 也即将上线。

SeedEdit3.0 基于文生图模型Seedream3.0开发,通过引入多样化的数据融合方法和特定奖励模型,解决了以往图像编辑模型在主体与背景保持、指令遵循等方面的不足。

根据介绍,该模型可处理并生成 4K 图像,在精细且自然地处理编辑区域的同时,还能高保真地维持其他信息。尤其针对图像编辑“哪里改与哪里不改”的取舍,该模型表现出更佳的理解力和权衡力,可用率相应提高。当用户需要去掉图片内一众行人,模型不仅可以准确识别并移除场景内的无关人物,连影子也能一并去掉。

评测结果显示,SeedEdit 3.0 在编辑保持效果、指令响应能力上领先于此前版本 SeedEdit 1.0,以及引入新数据源的 SeedEdit 1.5、进一步加入数据合并策略的 SeedEdit 1.6。对比 Gemini 2.0 和 Step1X,SeedEdit 3.0 也有一定优势。我们同时观察到,GPT-4o 位于右下角,表明其图像保持能力较 SeedEdit 3.0 有差距,但指令遵循更为出色。

在综合测评中,SeedEdit 3.0 的图像保持能力最为突出,保持能力得分达到 4.07 分(满分 5 分),较此前版本 SeedEdit 1.6 得分提升 1.19 分;SeedEdit 3.0 可用率达 56.1%,较 SeedEdit 1.6 绝对值增加 17.46 个百分点。同时,SeedEdit 3.0 的指令遵循、生成质量表现也处于行业前列。

尽管 SeedEdit 3.0 在图像保持、可用率等方面表现不错,但项目团也承认,其在指令遵循方面仍有一定提升空间。未来除进一步优化编辑性能外,团队还将探索更丰富的编辑操作,让模型拥有连续多图生成、多张图像合成、故事性内容生成等能力。

更多详情可查看官方公告。


相關推薦

2025-04-18

字节跳动旗下「豆包大模型团队」发文表示,全新图像生成基础模型「Seedream 3.0」技术报告正式发布。 Seedream 3.0 是一个原生高分辨率、支持中英双语的图像生成基础模型,亮点如下: 原生 2K 直出,适配多比例场景:无需后

2025-05-24

跃参数,总参数量达140亿。 BAGEL集视觉理解、文生图、图像编辑于一体,在标准多模态理解基准测试中表现出色,优于现有顶级开源视觉语言模型如Qwen2.5-VL和InternVL-2.5。 在文本到图像生成质量上,BAGEL的表现可与专用生成

2025-04-18

字节跳动近日公布了一个仅 70 亿参数的视频生成基础大模型「Seaweed-7B」。 https://seaweed.video/ 令人惊喜的是,该模型以 66.5 万个 H100 GPU 小时训练成本,在文本/图像到视频生成任务中全面超越 140 亿参数的 Wan 2.1,具体来看:

2025-04-23

字节跳动旗下的 AI 原生集成开发环境(AI IDE)Trae 已发布 v1.3.0 版本,具体变更细节如下: 合并 Chat 与 Builder 面板。你可以通过 @Builder 方式将 Builder 作为智能体使用。详情参考《智能体》。 支持将文档内容和网页内容作为

2025-05-15

字节跳动正式开源了全新图像定制框架DreamO。该框架集成了图像换装、换脸、造型调整、风格迁移以及多主体组合等多种功能,旨在通过单一模型完成各种定制化任务。 https://github.com/bytedance/DreamO DreamO基于DiT(Diffusion Transform

2025-06-04

    ​​字节跳动开源Computer Use Agent:引领人机交互新革命​​ 在人工智能技术日新月异的今天,字节跳动再次以创新者的姿态,宣布开源其自主研发的Computer Use Agent(以下简称CUA)。这一举措不仅标志着字节跳动

2024-10-21

近日,有消息称字节跳动发生大模型训练被实习生“投毒”事件。 据悉,该事件发生在字节跳动商业化团队,因实习生田某某对团队资源分配不满,利用HF(huggingface)的漏洞,通过共享模型注入破坏代码,导致团队模型训练成

2024-09-25

字节跳动今天在深圳举办2024火山引擎 AI 创新巡展,并发布豆包·视频生成模型以及豆包·音乐模型、豆包·同声传译模型等产品。 据悉,豆包·视频生成模型能遵从复杂 prompt,解锁时序性多拍动作指令与多个主体间的交互能力

2025-04-15

字节跳动 Seed 最新思考模型 Seed-Thinking-v1.5 技术报告发布,涵盖在数据体系、奖励模型、RL 算法、基础设施等维度的探索: 通过数据层面的精细化处理提升推理能力,融合可验证数据和非可验证数据,并提出全新的评测基准

2025-05-10

字节跳动宣布正式开源其全新研发的社区驱动深度研究框架 DeerFlow。作为一款基于LangChain和LangGraph框架构建的智能研究助手,DeerFlow 深度整合了语言模型与网络搜索、爬虫、Python代码执行等专业工具。 DeerFlow旨在通过AI技术提

2025-04-29

字节跳动近日宣布推出其全新的数据选择框架 QuaDMix,旨在提升大型语言模型(LLM)预训练的效率和泛化能力。众所周知,模型的训练效果受基础数据集的质量和多样性影响很大。然而,传统的数据筛选方法往往将质量和多样性

2024-11-01

名公司内部的一些团队,比如腾讯、华为、百度、京东、字节跳动等等。 关于Showdoc的详细介绍,请看:https://www.showdoc.com.cn/help

2025-05-30

字节跳动公司发布了一款名为 “剪小映” 的新应用,其宣传口号 “捕捉美好,智创影片” 引发了广泛关注。 这也是字节继 “即梦 AI” 之后的又一力作。借助火山引擎的豆包大模型技术,“剪小映” 旨在为用户提供更加便

2025-04-16

在三月份的月活跃用户数(MAU)达到了近1.5亿,成功超越了字节跳动的 Doubao,成为中国最受欢迎的 AI 应用。 根据南华早报的报道,紧随其后的是 Doubao(豆包),月活跃用户接近1亿,DeepSeek 则约为7700万。 值得一提的是,阿里巴