Sora震撼科技界恐颠覆影视业

2024-02-22 00:00

Sora按文字提示生成的短片，可见一名时尚女性在霓虹灯光四射的东京街道行走，穿黑皮外套和连衣红裙。

美国人工智能（AI）公司OpenAI上周四宣布推出由文本转为影片的生成式AI模型Sora，可让用户透过简单的文字指令立即创造出逼真的影片，随即震撼中外高科技界，连日引发热议。Sora可根据文本指令创建近似现实且富有想像力的场景，生成多种风格的高清影片，最长为一分钟，恐颠覆影视产业。
创造聊天机械人ChatGPT和图像生成器DALL-E的OpenAI称，Sora（名字源于日文的天空）使用Transformer架构，可根据文字指令生成逼真影片，还能够根据静态图像生成影片，或对现有影片进行扩展或填充缺失的帧。现时Sora未向公众开放，仅主要给一些设计师和电影制作人等特定人群试用。但其横空出世已经在中外互联网和科技圈掀起热议。没有导演、演员的参与，Sora却能快速生成出高度细致的影片。有中国网民惊叹，就算失业也无话可说。

OpenAI官网的其中一段示范影片，显示一名穿深蓝色外套和红色连身裙的女子，走在东京繁华的街道上。除了商店文字有瑕疵外，女人的动作、四周环境都高度逼真，难以找出破绽。

AI在影片生成领域的巨大发展前景，为塑造影视产业新业态打开大门的同时，恐将颠覆现存影视产业。荷里活去年遭遇63年来首次编剧和演员全行业罢工，原因之一便是担忧该行业的部分工作被AI取代。Sora面世让这一威胁变得更逼近和真切。
业界：为深伪技术推波助澜

虽不是第一间涉足文本转影片领域的公司，但Sora的推出使OpenAI在这一赛道取得领先。OpenAI称，Sora对语言有深刻的理解，不仅了解用户文本提示，还了解所述事物在物理世界中的存在方式。「我们正在教授AI理解和模拟运动中的物理世界，目标是训练模型帮助人们解决需要与现实世界交互的问题。」

OpenAI行政总裁奥尔特曼邀请用户在社交平台X提出指令建议，几分钟后在这个平台上张贴颇具说服力的影片生成结果，其中包括两只黄金猎犬在山上开串流Podcast、老奶奶在厨房教烹饪、动物在海上骑脚踏车，以及珠光宝气的动物园等。还有另一段影片显示「半鸭半龙的生物飞驰在美丽的暮色中，背上骑着一只身着探险装备的仓鼠」。

不过，OpenAI警告，「目前的模型存有弱点」，影片中可能包含不合逻辑的图像，混淆左右等空间细节，难以准确模拟复杂场景的物理原理和因果关系实例等。例如，一个人咬了一口饼乾，饼乾上却没有咬痕。不过，随着模型改进，人们可能会在短期内获得更加完善的影片生成功能。

不少业内人士担心，Sora将为「深伪」技术推波助澜。加州大学柏克莱分校讯息学院副院长法里德就表示：「当新闻、图像、音频、视频——任何事情都可以伪造时，那么在那个世界里，就没有甚么是真实的。」针对造假顾虑，OpenAI称在真正面向公众推出产品时，将确保生成影片包含来源元数据，并推出检测视频真伪的工具。

關鍵字

以球迷荷兰遇袭总理派机助撤离

南韩逾8000医科生申请休学抗议扩招

Sora震撼科技界恐颠覆影视业

最新回应

相關新聞

美东港口料明大罢工势重创经济

普京要求伊朗最高领袖克制回应以色列

新德里机场塌遮雨天棚1死多伤

希腊沃洛斯市涌现鱼尸进紧急状态

订阅星岛日报

联络我们

广告表格及价目表