商汤推首个「可控人物」视频大模型可生成1分钟短片

2024-07-04 14:54

商汤推首个「可控人物」视频大模型可生成1分钟短片

商汤（020）今日（4日）于2024世界人工智能大会（WAIC 2024），推出首个可控人物视频生成大模型Vimi，并已在官网开放预约，以及会于明日（5日）披露更多有关细节。商汤表示，该模型只需一张任何风格的照片就能生成和目标动作一致的人物类短片，并支持多种驱动方式，通过已有人物影片、动画、声音、文字等多种元素进行驱动。

Vimi可稳定生成长达1分钟的单镜头人物类短片

Vimi可稳定生成长达1分钟的单镜头人物类短片

生成自然的光影

生成头发的飘动

生成一致的运镜

生成唱歌互动

生成舞蹈互动

Vimi提供唯美写真风、奇幻风等多种生成风格

Vimi提供唯美写真风、奇幻风等多种生成风格

可控制表情及上半身肢体动作

商汤指出，现时市面上相关技术仍存在挑战，包括无法精准控制人物动作与表情动作、人物外貌与背景效果变幻莫测，以及时长有限等问题；Vimi则不但可实现精准的人物表情控制，还可控制照片中人物上半身的自然肢体动作，并自动生成与人物相符的头发、服饰及背景变化。

商汤又指，光影变化方面Vimi也能做到合理生成，让人物动作和视觉效果流畅自然，更可稳定生成长达1分钟的单镜头人物类短片，画面效果不会随时间变化而降低品质或失真。

创作者可自由剪辑及二次创作

现时Vimi将完全向广大用户开放使用，用户只需上传不同角度的高清人物照片，即可自动生成数字分身和不同风格的写真短片；而生成的短片人物更能搭配手势、肢体动作、头发等，形成更完整动作，让创作者进行剪辑和二次创作。

此外，针对喜爱自拍及使用表情包的用户，Vimi支援聊天、唱歌、舞动等多种娱乐互动场景，并可通过单张图片驱动生成各种人物表情包。Vimi亦提供唯美写真风、奇幻风等多种生成风格，让用户仿佛穿越不同次元，享受沉浸式视觉体验。

關鍵字

7-Eleven拟引入另类产品吸旅客夥基金回收7CAFÉ咖啡渣为肥料

港铁今年最多加薪6.15% 庆通车45周年向全体员工发0.45个月奖金

最新回应

關鍵字

相關新聞

商汤日日新为新企业用户推免费服务赠5000万Token包

商汤日日新为新企业用户推免费服务赠5000万Token包

2024-06-27 17:29:53

商汤传配股集资最多20.5亿 CEO徐立早已预告上市3年蚀逾115亿人币

商汤传配股集资最多20.5亿 CEO徐立早已预告上市3年蚀逾115亿人币

2024-06-20 20:48:43

商汤：中国不缺人才 AI晶片制造商正加快「追落后」

商汤：中国不缺人才 AI晶片制造商正加快「追落后」

2024-05-28 11:32:31

商汤目标明年收支平衡现在不会考虑配股称「股价太低」

商汤目标明年收支平衡现在不会考虑配股称「股价太低」

2024-04-29 08:40:25

商汤称不知悉股价波动原因明起复牌发布「日日新5.0」后升三成致停牌

商汤称不知悉股价波动原因明起复牌发布「日日新5.0」后升三成致停牌

2024-04-24 17:54:42

商汤推「日日新5.0」扬言部份功能已超GPT-4 Turbo

商汤推「日日新5.0」扬言部份功能已超GPT-4 Turbo

2024-04-23 17:32:23

商汤AI数据分析工具办公小浣熊向港澳用户开放

商汤AI数据分析工具办公小浣熊向港澳用户开放

2024-02-20 16:57:16

You are currently at: std.stheadline.com

Skip This Ads