字节新 AI 视频模型 Waver 1.0 发布,支持多种艺术风格的视频生成


近日,字节的新AI视频模型Waver1.0正式发布,这是一款集多种功能于一体的视频生成模型,具有更强大的能力。Waver1.0支持文本到视频和图像到视频的转换,为用户提供了一种全新的创作体验。该模型在视频生成的质量和效果上,显著优于现有的开源和闭源模型。

亮点提要:

  • Waver1.0支持文本到视频和图像到视频的转换,提供全新的创作体验。
  • 支持多种艺术风格和长达10秒的视频生成,带来丰富的视觉效果。
  • 在运动质量和视觉质量上表现优于现有模型,适用于多镜头叙事。

在模型性能方面,Waver1.0在 Waver-Bench1.0和 Hermes Motion Testset 上的表现非常突出。在运动质量、视觉质量和提示跟随性等方面,经过人工评估,Waver1.0均显示出其优越性。

Waver1.0还具备多镜头叙事的能力,能够生成多镜头的连贯叙事视频。在镜头切换和时空转换时,模型可以保证核心主题、视觉风格和整体氛围的高度一致性,确保视频的连续性。此外,Waver1.0支持生成长达10秒的视频,使情感和动作表达更为完整。

在艺术风格上,Waver1.0支持多种艺术风格的视频生成,包括极致现实、动画、粘土、毛绒等,为用户带来丰富多彩的视觉盛宴。在复杂运动的生成方面,Waver1.0在体育场景中也展现了良好的表现,尽管在一些复杂领域仍需进一步提升。

Waver1.0也扩展了其运动能力,适用于动物运动的生成,为用户提供了新的创意可能性。无论你来自何处,都可以利用 Waver1.0实现你的创造力,共同为人工智能生成内容(AIGC)创造更美好的未来

详情入口:https://www.waver.video/


相關推薦

2025-07-23

来自字节跳动(ByteDance)的神秘新视频模型Waver 1.0已现身Video Arena排行榜,并在榜单上进入了第三名的位置。 值得关注的是,这款模型在文生视频和图生视频榜单上都是排名第三。文生视频仅次于字节之前发布的Seedance 1.0和

2024-09-25

字节跳动今天在深圳举办2024火山引擎 AI 创新巡展,并发布豆包·视频生成模型以及豆包·音乐模型、豆包·同声传译模型等产品。 据悉,豆包·视频生成模型能遵从复杂 prompt,解锁时序性多拍动作指令与多个主体间的交互能力

2023-10-26

查,以确保用户可以方便举报冒犯性内容,并限制照片和视频权限。【AiBase提要:】📌 谷歌强化 Android 应用监管规定,要求应用提供举报冒犯内容的途径。📌 Android 应用必须在明年初前添加举报冒犯材料的按钮,以继续在谷歌 P

2025-07-08

Kling 等通用视频生成模型,AniSora V3 专注于动漫领域。与字节跳动的 EX-4D 相比,AniSora V3 更专注于 2D / 2.5D 动漫风格,而非 4D 多视角生成。

2025-06-19

在近期的人工智能视频生成领域,字节跳动悄然发布了一款名为 Seedance1.0的新模型,该模型在独立的评测中已经超越了谷歌最新推出的 Veo3。 Seedance1.0的研究论文中详细介绍了该模型的创新之处。字节跳动的团队通过对空间和时

2025-04-12

Possible 上表示,谷歌计划最终将其 Gemini AI 模型与其Veo 视频生成模型相结合,以提高前者对物理世界的理解。 Hassabis 表示:“我们从一开始就将 Gemini 打造成多模式的基础模型,我们这样做的原因是我们对通用数字助理这一理

2024-08-09

语言处理等前沿算法,能够自动生成文本、图像、音频和视频等内容,极大地拓展了创意产业的边界。 尤其在绘画领域,AI 技术极大提升了绘画创作的效率,降低了创作门槛,甚至能够根据用户的需求,创作出独特的艺术作品

2024-07-05

商汤发布首个“可控”人物视频生成大模型Vimi,该模型主要面向C端用户,支持聊天、唱歌、舞动等多种娱乐互动场景。 商汤方面称,Vimi可生成长达1分钟的单镜头人物类视频,画面效果不会随着时间的变化而劣化或失真,Vimi

2025-04-17

HiDream 智象未来团队宣布正式开源图像生成大模型 HiDream-I1 与交互编辑模型 HiDream-E1。 HiDream-I1 在权威榜单 Artificial Analysis 中 24 小时内登顶,成为首个跻身全球第一梯队的中国自研生成式 AI 模型,并在图像质量、语义理解、艺

2025-06-08

法能够根据音频和各种可选的控制条件生成高质量的肖像视频。通俗来讲,就是给定一张照片和一段音频,就可以生成对应的视频,同时还能精准控制人物的表情和头部姿态。相关研究成果已被人工智能顶会 ICML 2025 收录,项目

2025-04-16

会上宣布,基座模型再次升级,面向全球正式发布可灵2.0视频生成模型及可图2.0图像生成模型。可灵2.0模型在动态质量、语义响应、画面美学等维度,保持全球领先;可图2.0模型在指令遵循、电影质感及艺术风格表现等方面显著

2025-08-12

免费开源AI数字人系统,小白也可使用。 支持智能直播、视频合成、声音合成、声音克隆,简化本地模型管理、一键导入和使用AI模型。 禁止使用本产品进行违法违规业务,使用本软件请遵守中华人民共和国法律法规。

2024-08-20

昆仑万维发布全球首个集成视频大模型与3D大模型的AI短剧平台SkyReels。集剧本生成、角色定制、分镜、剧情、对白/BGM及影片合成于一体,旨在让创作者“一键成剧”,轻松制作高质量AI视频。 SkyReels平台集成了昆仑万维自研剧

2025-04-18

个简单易用的一站式AI数字人系统,小白也可使用。 支持视频合成、声音合成、声音克隆,简化本地模型管理、一键导入和使用AI模型。 禁止使用本产品进行违法违规业务,使用本软件请遵守中华人民共和国法律法规。 模