OpenAI正式发布,文字直接生成视频!网友:我要失业了

2024-02-16 20:31:24 - 中国经济网

2月16日,OpenAI正式发布了首款文生视频大模型Sora,范例视频一经发布迅速引发业内热议,其接近商业化的水准的运镜呈现能力让网友直呼,“又有一个行业的人要失业了”。

OpenAI正式发布,文字直接生成视频!网友:我要失业了

据介绍,Sora可以直接输出长达60秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。

目前OpenAI官网上已经更新了48个视频demo,在这些demo中,Sora不仅能准确呈现细节,还能理解物体在物理世界中的存在,并生成具有丰富情感的角色。该模型还可以根据提示、静止图像甚至填补现有视频中的缺失帧来生成视频。

例如一个Prompt(大语言模型中的提示词)的描述是:在东京街头,一位时髦的女士穿梭在充满温暖霓虹灯光和动感城市标志的街道上。

在Sora生成的视频里,女士身着黑色皮衣、红色裙子在霓虹街头行走,不仅主体连贯稳定,还有多镜头,包括从大街景慢慢切入到对女士的脸部表情的特写,以及潮湿的街道地面反射霓虹灯的光影效果。

OpenAI正式发布,文字直接生成视频!网友:我要失业了

OpenAI正式发布,文字直接生成视频!网友:我要失业了

有网友直呼“工作要丢了”,还有网友表示,电影业要彻底颠覆了。

OpenAI正式发布,文字直接生成视频!网友:我要失业了

OpenAI正式发布,文字直接生成视频!网友:我要失业了

OpenAI正式发布,文字直接生成视频!网友:我要失业了

OpenAI正式发布,文字直接生成视频!网友:我要失业了

OpenAI正式发布,文字直接生成视频!网友:我要失业了

自去年大模型热潮兴起以来,围绕大语言模型,国内外的厂商推出了大量相关的大模型应用。不过从目前来看,除了对话类的大模型外,大部分大模型在商业上的性能均有待提高。而此次OpenAI的新模型则让业内看到了文生视频系大模型商业化的前景。此次Sora在范例演示中展现的多种性能已经非常接近视频工业中的日常需求。

OpenAI表示,他们正在教AI理解和模拟运动中的物理世界,目标是训练模型来帮助人们解决需要现实世界交互的问题。Sora将首先提供给网络安全教授,以评估产品的危害或风险。一些视觉艺术家、设计师和电影制作人也能获得Sora的访问权限,以此收集关于创意专业人士如何使用Sora的反馈。

据了解,目前Sora在部分细节的生成上依然存在问题,如会凭空生成目标。同时对于一些复杂的物理场景,Sora也可能会生成错误的物体,如沙滩上浮空的塑料椅子等。

今日热搜