Sora震撼科技界 恐颠覆影视业
2024-02-22 00:00
美国人工智能(AI)公司OpenAI上周四宣布推出由文本转为影片的生成式AI模型Sora,可让用户透过简单的文字指令立即创造出逼真的影片,随即震撼中外高科技界,连日引发热议。Sora可根据文本指令创建近似现实且富有想像力的场景,生成多种风格的高清影片,最长为一分钟,恐颠覆影视产业。
创造聊天机械人ChatGPT和图像生成器DALL-E的OpenAI称,Sora(名字源于日文的天空)使用Transformer架构,可根据文字指令生成逼真影片,还能够根据静态图像生成影片,或对现有影片进行扩展或填充缺失的帧。现时Sora未向公众开放,仅主要给一些设计师和电影制作人等特定人群试用。但其横空出世已经在中外互联网和科技圈掀起热议。没有导演、演员的参与,Sora却能快速生成出高度细致的影片。有中国网民惊叹,就算失业也无话可说。
AI在影片生成领域的巨大发展前景,为塑造影视产业新业态打开大门的同时,恐将颠覆现存影视产业。荷里活去年遭遇63年来首次编剧和演员全行业罢工,原因之一便是担忧该行业的部分工作被AI取代。Sora面世让这一威胁变得更逼近和真切。
业界:为深伪技术推波助澜
虽不是第一间涉足文本转影片领域的公司,但Sora的推出使OpenAI在这一赛道取得领先。OpenAI称,Sora对语言有深刻的理解,不仅了解用户文本提示,还了解所述事物在物理世界中的存在方式。「我们正在教授AI理解和模拟运动中的物理世界,目标是训练模型帮助人们解决需要与现实世界交互的问题。」
OpenAI行政总裁奥尔特曼邀请用户在社交平台X提出指令建议,几分钟后在这个平台上张贴颇具说服力的影片生成结果,其中包括两只黄金猎犬在山上开串流Podcast、老奶奶在厨房教烹饪、动物在海上骑脚踏车,以及珠光宝气的动物园等。还有另一段影片显示「半鸭半龙的生物飞驰在美丽的暮色中,背上骑着一只身着探险装备的仓鼠」。
不过,OpenAI警告,「目前的模型存有弱点」,影片中可能包含不合逻辑的图像,混淆左右等空间细节,难以准确模拟复杂场景的物理原理和因果关系实例等。例如,一个人咬了一口饼乾,饼乾上却没有咬痕。不过,随着模型改进,人们可能会在短期内获得更加完善的影片生成功能。
不少业内人士担心,Sora将为「深伪」技术推波助澜。加州大学柏克莱分校讯息学院副院长法里德就表示:「当新闻、图像、音频、视频——任何事情都可以伪造时,那么在那个世界里,就没有甚么是真实的。」针对造假顾虑,OpenAI称在真正面向公众推出产品时,将确保生成影片包含来源元数据,并推出检测视频真伪的工具。
關鍵字
最新回应