生树科技发布高可控 AI 视频大模型「Vidu Q1」


生树科技旗下的 Vidu AI 发布了业内首个高可控 AI 视频大模型「Q1」。

据介绍,Vidu Q1 在多主体细节可控、音效同步可控、画质增强等方面都取得出色表现。并且 Vidu Q1 在四大核心能力进行了全面升级:

  • 极「质」高清:画质细节全面提升,出片更清晰、更具质感;
  • 极「质」镜头:首尾帧衔接更顺滑,镜头语言更具电影感;
  • 极「质」音效:一句话生成专属音效,支持时段自定义和音效叠加;
  • 极「质」风格:动漫风格再度升级,稳定流畅、更具表现力。

目前,Vidu Q1 已上线 Vidu 官网,支持时长 5 秒、1080p 的视频生成。

根据官方介绍,Vidu Q1 作为业内首个高可控 AI 视频大模型,其在多主体细节可控(特别是动作、布局可控)、音效同步可控、画质增强等方面均取得显著成效。

以多主体细节可控为例,在语义指令的基础上,通过融入参考图的视觉指令,Vidu Q1支持对场景中多主体的位置、大小、运动轨迹等属性进行更进一步的可控,对所有动作行为(出场、退场、坐立姿态、行动路线)进行精准调整。用户能够明显体验到用更低的抽卡率实现更高质量的可控生成。

音效同步可控功能则确保了随着视频环境与画面转场,Vidu Q1 能够输出生成相应音效,并可精准控制每段音效的长短区间,精准设置每段音频出现的时间点,如 0-2s 风声、3-5s 雨声等,节省时间的同时,也大大增强了视频的沉浸感与感染力。

Vidu Q1 模型通过进一步增强画质,则能够为用户带去更加清晰、细腻、逼真的视觉体验。


相關推薦

2024-07-05

成数字分身和不同风格的写真视频。目前,Vimi已在商汤科技官网开放预约。 Vimi 也入选了2024世界人工智能大会的“镇馆之宝”名单。其他入选的还包括阿里云AI编程助手通义灵码、支付宝智能助理、智谱AI基座大模型、特斯拉

2025-03-27

新步伐,紧跟世界先进水平。 有外媒近日报道称,中国科技公司选择开源路线,不仅是为了与同类型公司展开竞争,更是为了加速AI的采用和创新。开源模型降低了成本,为产品创新打开了大门。这一趋势不仅将推动中国AI领域

2024-01-23

殷勇作政府工作报告时指出,2023年,北京加快建设国际科技创新中心,加强科技领军人才尤其是青年人才培养引进,实施基础研究领先行动和关键核心技术攻坚战行动,推动在京国家实验室高质量运行,支持新型研发机构开展

2023-09-29

南方电网人工智能科技有限公司负责研发的电力行业人工智能创新平台及自主可控电力大模型正式公开发布。 电力行业人工智能创新平台提供模型即服务(MaaS),支持模型快速迭代开发,并支撑电力人工智能资源面向全社会开

2025-04-23

抖音发布《2025第一季度黑产治理数据报告》指出,今年第一季度,抖音封禁水军、欺诈和违规导流相关黑产账号260万个,并将涉嫌违法犯罪的线索上报有关部门。 公告称,在大模型基础上,通过构建以 AI 为核心的治理体系,

2024-08-20

昆仑万维发布全球首个集成视频大模型与3D大模型的AI短剧平台SkyReels。集剧本生成、角色定制、分镜、剧情、对白/BGM及影片合成于一体,旨在让创作者“一键成剧”,轻松制作高质量AI视频。 SkyReels平台集成了昆仑万维自研剧

2025-03-21

,支持生成102帧、5秒、540P分辨率的视频,具备运动幅度可控和镜头运动可控两大核心特点,同时天生具备一定的特效生成能力。 公告称,和目前已有开源图生视频模型相比,Step-Video-TI2V 不仅在参数规模上对该领域的研究提供

2024-08-27

举行的第四届RISC-V中国峰会上,中国电信研究院、天翼云科技公司联合中国科学院软件所、达摩院等合作伙伴发布业界首个RISCV云计算试验平台“北海”,RVEI战略指导委员会主任、中国工程院院士倪光南共同参与发布。 中国电

2024-10-31

态,彩页提供多样且丰富的阅读体验,涵盖影视、财经、科技、娱乐等各个领域。彩页不仅可以发布到首页供其他用户点赞和收藏,还可以用于制作个人的工作或学习PPT;宝典则是AI时代的新型知识网页。当用户搜索任意问题时

2023-10-28

增股份,长期助力昆仑万维成为一家全球领先的人工智能科技企业。 报告称,在国内AGI与AIGC领域,其“天工”大模型在逻辑推理、文本理解、多模态能力等多个方面均取得了显著突破。基于大模型核心能力的提升,“天工”A

2023-05-18

面向签署该协议或者在鲲鹏硬件授权使用该软件包。澎峰科技的PerfMPL已经支持了多种主流指令集,如RISC-V、x86、ARM、RISC-V等指令集,并面向领域提供定向优化版本,商业版本不开源。还有CUDA这类的GPU并行数学计算库(cuBLAS、cuFF

2023-03-02

模型“悟道2.0”。为了推动大模型方向的协同创新,在“科技创新2030”新一代人工智能重大科技项目支持下,2023年初,智源研究院联合30多家产学研单位共同承担的旗舰项目“人工智能基础模型支撑平台与评测技术”全面启动

2025-04-04

动实际支出的50%,给予最高300万元支持。 政策同时鼓励科技出海,也有相关的规定。 (八)实施出海扬帆行动,开拓国际市场新航道 支持企业提高国际竞争力,拓展海外业务。对产业带动强、科技含量高、示范效果好,首

2025-04-17

AI 科技评论独家获悉,字节 AI Lab 即将全部收归 Seed 团队下。 字节 AI Lab 是 Seed 成立之前字节主要的 AI 研发部门,目前由李航管理,自2024年开始向 Seed 时任负责人朱文佳汇报。今年2月下旬,原 Google DeepMind 副总裁吴永辉入职字