字节跳动发布豆包视频生成大模型

2024-09-25 發表於开源资讯

字节跳动今天在深圳举办2024火山引擎 AI 创新巡展，并发布豆包·视频生成模型以及豆包·音乐模型、豆包·同声传译模型等产品。

据悉，豆包·视频生成模型能遵从复杂 prompt，解锁时序性多拍动作指令与多个主体间的交互能力。

据火山引擎介绍，豆包视频生成模型基于DiT架构，通过高效的DiT融合计算单元，让视频在大动态与运镜中自由切换，拥有变焦、环绕、平摇、缩放、目标跟随等多镜头语言能力，灵活控制视角，带来真实世界的体验。支持包括黑白、3D 动画、2D 动画、国画等多种风格，包含1:1、3:4、4:3、16:9、9:16、21:9 六个比例，适配于各种终端，以及电影、手机竖屏等不同画幅。

字节跳动表示，豆包·视频生成模型可以大幅降低动画的制作成本，生动的呈现童话故事情节。此外，还有城市文旅、音乐 MV、微电影、短剧等应用场景，都可以通过豆包·视频生成模型实现降本提效和创意合规。

相關推薦

字节跳动商业化团队模型训练被“投毒”，内部人士称未影响豆包大模型

2024-10-21

近日，有消息称字节跳动发生大模型训练被实习生“投毒”事件。据悉，该事件发生在字节跳动商业化团队，因实习生田某某对团队资源分配不满，利用HF（huggingface）的漏洞，通过共享模型注入破坏代码，导致团队模型训练成

火山引擎总裁谭待：豆包大模型“地板价”，仍有盈利空间

2024-09-26

模型原名“云雀”，是国内通过算法备案的大模型之一。字节跳动基于豆包大模型打造了 AI 对话助手“豆包”、AI应用开发平台“扣子”、互动娱乐应用“猫箱”，以及星绘、即梦等 AI 创作工具，并把大模型接入抖音、番茄小

字节推出全新 AI 剪辑应用 “剪小映”

2025-05-30

字节跳动公司发布了一款名为 “剪小映” 的新应用，其宣传口号 “捕捉美好，智创影片” 引发了广泛关注。这也是字节继 “即梦 AI” 之后的又一力作。借助火山引擎的豆包大模型技术，“剪小映” 旨在为用户提供更加便

前字节 Seed 大语言模型负责人乔木被辞退

2025-06-25

此前，一份有关字节跳动豆包大模型核心技术人员乔某及同组HRBP程某存在不正当关系的举报文件在网上广泛传播。6月23日，红星资本局获悉，字前字节Seed大语言模型负责人乔木以及关联HRBP已被辞退。字节在最新发布的一期

AI 专区上新啦！豆包、通义、360 AI、天工 AI、澜舟智库等入驻麒麟软件商店

2024-08-14

公，效率翻倍。豆包抖音旗下的人工智能产品，基于字节跳动推出的自研豆包大模型。豆包电脑版以“豆包”主智能体为核心，集合AI搜索、写作、阅读总结、图像生成功能于一体，能够在工作、学习等各种场景为你提供帮

挑战 ChatGPT，国产有这 8 款 AI 大模型产品

2023-09-08

Google 开发者在线课程开始学习 8 月 31 日，百度、字节、商汤、中科院旗下紫东太初、百川智能、智谱华章等 8 家企业 / 机构的大模型产品已经首批通过《生成式人工智能服务管理暂行办法》备案，可正式上线面向公众提供服

字节视觉大模型负责人今日内部官宣“暂时休息”

2025-07-18

根据网易科技的独家报道，7月17日上午，字节跳动豆包大模型视觉多模态生成方向负责人杨建朝在公司内部宣布“暂时休息”，相关工作已完成交接，其职务由周畅（花名“时光”）接手。周畅所在架构为“多模态交互与世界

字节跳动发布视频生成基础大模型 Seaweed-7B

2025-04-18

字节跳动近日公布了一个仅 70 亿参数的视频生成基础大模型「Seaweed-7B」。 https://seaweed.video/ 令人惊喜的是，该模型以 66.5 万个 H100 GPU 小时训练成本，在文本/图像到视频生成任务中全面超越 140 亿参数的 Wan 2.1，具体来看：

豆包公布 Seedream 3.0 文生图模型技术报告

2025-04-18

字节跳动旗下「豆包大模型团队」发文表示，全新图像生成基础模型「Seedream 3.0」技术报告正式发布。 Seedream 3.0 是一个原生高分辨率、支持中英双语的图像生成基础模型，亮点如下：原生 2K 直出，适配多比例场景：无需后

夸克 AI 月活跃用户达 1.5 亿，超越节跳动豆包

2025-04-16

在三月份的月活跃用户数(MAU)达到了近1.5亿，成功超越了字节跳动的 Doubao，成为中国最受欢迎的 AI 应用。根据南华早报的报道，紧随其后的是 Doubao(豆包)，月活跃用户接近1亿，DeepSeek 则约为7700万。值得一提的是，阿里巴

字节跳动推出视频字幕无痕擦除方案，基于 DiT 大模型打造

2025-08-13

字节跳动技术团队宣布推出一项创新技术，基于DiT大模型与字体级分割的视频字幕无痕擦除方案，旨在助力短剧等视频内容的全球化传播。在全球化内容制作中，原始视频的中文字幕对于海外观众而言不仅是无效信息，还严重

豆包 1.5 · 深度思考模型上线边缘大模型网关

2025-04-26

字节跳动方面宣布，其火山引擎边缘大模型网关已全面支持豆包 1.5・深度思考模型。即日起，用户可以在边缘大模型网关使用豆包全系列模型，并享受 200 万 tokens 免费额度，只要在网关访问密钥使用了本次新增的豆包大模型

字节跳动发布图像编辑模型 SeedEdit 3.0

2025-06-07

字节跳动 Seed 团队宣布正式发布了图像编辑模型SeedEdit3.0，技术报告对外公开，模型同步在即梦网页端开启测试，豆包 App 也即将上线。 SeedEdit3.0 基于文生图模型Seedream3.0开发，通过引入多样化的数据融合方法和特定奖励模型，

字节跳动 Seedance 1.0 模型评测结果超越谷歌 Veo 3

2025-06-19

在近期的人工智能视频生成领域，字节跳动悄然发布了一款名为 Seedance1.0的新模型，该模型在独立的评测中已经超越了谷歌最新推出的 Veo3。 Seedance1.0的研究论文中详细介绍了该模型的创新之处。字节跳动的团队通过对空间和时

熱門推薦