商汤发布首个“可控”人物视频生成大模型 Vimi


商汤发布首个“可控”人物视频生成大模型Vimi,该模型主要面向C端用户,支持聊天、唱歌、舞动等多种娱乐互动场景。

商汤方面称,Vimi可生成长达1分钟的单镜头人物类视频,画面效果不会随着时间的变化而劣化或失真,Vimi基于商汤日日新大模型,通过一张任意风格的照片就能生成和目标动作一致的人物类视频,并支持多种驱动方式,可通过已有人物视频、动画、声音、文字等多种元素进行驱动。

与图片表情控制类技术只能控制头部表情动作不同,商汤介绍,Vimi能够实现精准的人物表情控制,还可实现在半身区域内控制照片中人物的自然肢体变化,并自动生成与人物相符的头发、服饰及背景变化。

同时光影变化也能做到合理生成,让人物动作和视觉效果流畅自然,画面和谐唯美。更重要的是,Vimi 具备极强的稳定性,可稳定生成长达1分钟的单镜头人物类视频,画面效果不会随着时间的变化而劣化或失真,真正满足娱乐互动等需要长时间稳定视频生成需求。

据悉Vimi将完全面向C端用户开放使用。用户只需上传不同角度的高清人物图片,即可自动生成数字分身和不同风格的写真视频。目前,Vimi已在商汤科技官网开放预约。

Vimi 也入选了2024世界人工智能大会的“镇馆之宝”名单。其他入选的还包括阿里云AI编程助手通义灵码、支付宝智能助理、智谱AI基座大模型、特斯拉赛博越野旅行车等。


相關推薦

2024-08-20

昆仑万维发布全球首个集成视频大模型与3D大模型的AI短剧平台SkyReels。集剧本生成、角色定制、分镜、剧情、对白/BGM及影片合成于一体,旨在让创作者“一键成剧”,轻松制作高质量AI视频。 SkyReels平台集成了昆仑万维自研剧

2023-09-08

ogle 开发者在线课程 开始学习 8 月 31 日,百度、字节、商汤、中科院旗下紫东太初、百川智能、智谱华章等 8 家企业 / 机构的大模型产品已经首批通过《生成式人工智能服务管理暂行办法》备案,可正式上线面向公众提供服务

2023-09-29

力行业人工智能创新平台及自主可控电力大模型正式公开发布。 电力行业人工智能创新平台提供模型即服务(MaaS),支持模型快速迭代开发,并支撑电力人工智能资源面向全社会开放共享。百度提供了昆仑芯AI芯片、飞桨框架

2024-09-26

阿里通义实验室发布了一个用于可控角色视频合成的通用模型 MIMO,能够模仿任何人在复杂动作和物体交互的场景中的表现。简单讲,用户只要给定一个图像和视频或者动作序列,它就能把给定图像的人物直接替换成视频里面

2024-09-26

余个业务,用以提升效率和优化产品体验。 此次活动还发布了视频生成模型、音乐模型、同声传译模型。在谭待的展示下,视频生成模型生成的多主体多动作交互镜头,人物表情流露真实,动作流畅自然。对于同一个场景,模

2024-01-23

,高级别自动驾驶示范区实现160平方公里连片运行,全国首个数据基础制度先行区启动建设,数字经济增加值占地区生产总值比重达42.9%。 殷勇说,今年,北京将加快发展新质生产力。实施制造业重点产业链高质量发展行动,

2024-08-22

不显著;并且市场格局也主要还是由早期投入者如百度、商汤、智谱、百川等公司构成。 进入2024年,头部互联网公司加大对大模型的投入且发起价格战,为早期的大模型初创企业带来一定的竞争压力。预计未来 2-3 年,市场格

2024-07-17

腾讯宣布开源可控视频生成框架 MimicMotion,该框架可以通过提供参考人像及由骨骼序列表示的动作,来产生平滑的高质量人体动作视频。 公告称,大量的实验结果和用户调研表明MimicMotion在各种方面都显著优于以往的方法。目

2023-09-22

预训练模型技术和应用评估方法第1部分:金融大模型》发布成为国内首个金融行业大模型标准,为金融行业智能化的高质量发展提供了重要支撑,为全面促进大模型安全合规和可信发展提供了重要保障。 具体来看,该标准涵盖

2023-11-07

通过备案的 AI 大模型包括百度文心一言、百川智能、商汤商量 SenseChat、抖音(云雀大模型)、智谱 AI(GLM 大模型)、中科院(紫东太初大模型)、上海 MiniMax(ABAB 大模型)、上海人工智能实验室(书生通用大模型)、“360

2023-09-27

语言模型 国产模型:通义千问,文心一言,讯飞星火,商汤日日新,腾讯混元大语言模型 开源大模型:Llama2 ,ChatGLM2 ,AquilaChat 7B ,Bloomz 7B 等,后续还将开放更多 文生图、图生图、超分辨率、黑白图片上色等功能,集成 S

2023-07-08

的大会主题演讲中,华为常务董事、华为云CEO张平安重磅发布盘古大模型3.0和昇腾AI云服务。其中,盘古大模型3.0围绕“行业重塑”“技术扎根”“开放同飞”三大创新方向,持续打造核心竞争力,为行业客户、伙伴及开发者提

2024-10-31

10月29日,昆仑万维发布了2024年第三季度报告。截至本报告期末,公司实现营业收入38.3亿元,同比增长4%。今年前三季度,公司海外业务收入占比进一步提升至89.7%,同比增加5.6个百分点;整体毛利率达76.9%,继续保持在较高水平

2023-06-29

6月28日,上海世界移动通信大会期间,中国联通发布图文大模型“鸿湖图文大模型1.0”,并表示这是首个面向运营商增值业务的大模型。 鸿湖图文大模型目前拥有8亿训练参数和20亿训练参数两个版本,可以实现以文生图、视频