​字节跳动 Seedance 1.0 模型评测结果超越谷歌 Veo 3


在近期的人工智能视频生成领域,字节跳动悄然发布了一款名为 Seedance1.0的新模型,该模型在独立的评测中已经超越了谷歌最新推出的 Veo3。

Seedance1.0的研究论文中详细介绍了该模型的创新之处。字节跳动的团队通过对空间和时间层的解耦,结合了多模态位置编码,从而使得该模型能够同时处理文本到视频和图像到视频的生成任务。这样的方法支持复杂的场景切换和多镜头叙事,保持了一致的主题表现。

此外,Seedance1.0的性能离不开字节跳动强大的数据管道。团队精心构建了一个大规模、多来源的数据集,配有详细的双语注释和丰富的动作与静态特征标注,确保生成内容的准确性。同时,采用了一种新颖的强化学习设置,结合了三个奖励模型,重点关注基础对齐、动作质量和美观度。

在评测中,Seedance1.0在多个维度上超过了 Veo3。在与电影导演合作开发的 SeedVideoBench 基准测试中,该模型在遵循提示和动作真实感方面取得了更高的分数。在图像到视频的任务中,Seedance 保持了输入帧的视觉一致性,而 Veo3则在某些情况下出现了光照和纹理的变化。

在推理性能方面,Seedance1.0也表现出色。该模型能够在41.4秒内生成一段1080p 的五秒视频,这一速度远超其他竞争对手,如 Sora、Runway Gen-4和 Veo3。字节跳动还表示,他们在降低成本和延迟方面取得了重大进展,使得视频生成向实时应用的目标迈进了一步。

Seedance1.0计划于2025年6月集成到 Doubao 和 Jimeng 等平台,旨在显著改善专业工作流程和常规创作任务。虽然 Veo3因首次结合了真实视频与环境音效和对话而备受瞩目,但 Seedance1.0在视觉保真度、运动稳定性和叙事连贯性方面表现更为出色,虽然在音频能力上有所欠缺。


相關推薦

2025-07-23

频榜单上都是排名第三。文生视频仅次于字节之前发布的Seedance 1.0和谷歌的Veo3,图生视频仅次于Seedance 1.0和MiniMax的Hailuo 02模型。 字节上个月发布了Seedance 1.0。在评测中,Seedance1.0在多个维度上超过了Veo3。在与电影导演合作开

2025-06-19

最新排名中,在图像生视频类别下,Hailuo 02 目前与 Veo3、Seedance-1.0-pro 处于排行榜前三的位置。

2025-06-07

识别并移除场景内的无关人物,连影子也能一并去掉。 评测结果显示,SeedEdit 3.0 在编辑保持效果、指令响应能力上领先于此前版本 SeedEdit 1.0,以及引入新数据源的 SeedEdit 1.5、进一步加入数据合并策略的 SeedEdit 1.6。对比 Gemini 2

2025-07-17

字节跳动Seed团队携手香港大学与复旦大学,共同推出了创新的强化学习训练方法——POLARIS。该方法通过精心设计的Scaling RL策略,成功将小模型的数学推理能力提升至与超大模型相媲美的水平,为人工智能领域的小模型优化提供

2025-04-12

合主持的播客 Possible 上表示,谷歌计划最终将其 Gemini AI 模型与其Veo 视频生成模型相结合,以提高前者对物理世界的理解。 Hassabis 表示:“我们从一开始就将 Gemini 打造成多模式的基础模型,我们这样做的原因是我们对通用数

2023-07-13

国和美国的互联网大厂(比如谷歌、Meta、腾讯、百度、字节跳动),以及 AI 头部初创企业,都会有能力构建出可以媲美 GPT-4 甚至超越 GPT-4 的大模型。 而 OpenAI 最持久的护城河,就在于他们拥有真实用户的使用反馈、业内最顶

2025-04-18

字节跳动近日公布了一个仅 70 亿参数的视频生成基础大模型「Seaweed-7B」。 https://seaweed.video/ 令人惊喜的是,该模型以 66.5 万个 H100 GPU 小时训练成本,在文本/图像到视频生成任务中全面超越 140 亿参数的 Wan 2.1,具体来看:

2025-07-23

字节跳动Seed团队正式推出全新Vision-Language-Action Model(VLA)模型 GR-3,该模型在机器人操作领域展现出突破性能力,不仅能理解包含抽象概念的语言指令,还可精准操作柔性物体,并具备快速迁移至新任务、认识新物体的泛化能

2025-04-16

在三月份的月活跃用户数(MAU)达到了近1.5亿,成功超越了字节跳动的 Doubao,成为中国最受欢迎的 AI 应用。 根据南华早报的报道,紧随其后的是 Doubao(豆包),月活跃用户接近1亿,DeepSeek 则约为7700万。 值得一提的是,阿里巴

2025-06-17

更新:针对有消息称,字节人工智能实验室 (AI Lab) 负责人李航已经正式卸任,其在内部系统的身份变为劳务/顾问一事,字节相关负责人回应《科创板日报》:“李航是退休返聘,管理范围没有变化。” 据爆料,字节跳

2025-06-12

火山引擎正式发布了豆包大模型1.6、豆包·视频生成模型 Seedance 1.0 pro、豆包·语音播客模型。 全新发布的豆包大模型1.6系列由三个模型组成: doubao-seed-1.6:All-in-One 的综合模型,是国内首个支持256K 上下文的思考模型,支

2025-04-29

字节跳动近日宣布推出其全新的数据选择框架 QuaDMix,旨在提升大型语言模型(LLM)预训练的效率和泛化能力。众所周知,模型的训练效果受基础数据集的质量和多样性影响很大。然而,传统的数据筛选方法往往将质量和多样性

2025-04-15

字节跳动 Seed 最新思考模型 Seed-Thinking-v1.5 技术报告发布,涵盖在数据体系、奖励模型、RL 算法、基础设施等维度的探索: 通过数据层面的精细化处理提升推理能力,融合可验证数据和非可验证数据,并提出全新的评测基准

2025-05-10

字节跳动宣布正式开源其全新研发的社区驱动深度研究框架 DeerFlow。作为一款基于LangChain和LangGraph框架构建的智能研究助手,DeerFlow 深度整合了语言模型与网络搜索、爬虫、Python代码执行等专业工具。 DeerFlow旨在通过AI技术提