sora是干什么的

2024-02-22 15:16:21

sora这款软件很多用户都有听到过,这款软件有什么功能呢,在哪可以体验sora呢,别着急,接下来跟着小编一起看看具体介绍吧。

image.png

sora官网入口地址

sora官网:点击跳转

1、Sora 是什么?

那么,Sora 到底是什么呢?

发布的首个文本生成视频模型“Sora”,该模型通过接收文本指令,即可生成长达60秒的短视频。

2、Sora 的优势和不足

2.1 现实世界拟真

教人工智能理解和模拟运动中的物理世界,目标是训练模型,帮助人们解决需要现实世界交互的问题。

让机器能够像人类一样,对世界产生一个全面而准确的认知。这一特性使得AI视频生成更流畅、更符合逻辑。

这个可以看文章后面官网的视频,基本上看不出来是AI制作的,很逼真。

2.2 长视频能力

Sora 可以生成长达一分钟的视频,同时保持视觉质量并遵守用户的提示。

这个能力应该是当前所有文本生成视频模型所不具备的,在 Sora 没出来之前,文本生成视频领域的大哥应该是 Runway,但是Runway也只能生成4秒长的视频,用户可以将其最多延长至16秒,是AI生成视频在2023年所能达到的最长时长纪录。

为啥生成视频难?视频一秒目前大概是16帧左右,两秒就要生成32张图片,而且图片之间还要有连贯的逻辑。

image.png

2.3 多角色、更细节、更准确

Sora 能够生成具有多个角色、特定类型的运动以及主题和背景的准确细节的复杂场景。

该模型不仅了解用户在提示中要求的内容,还了解这些东西在物理世界中的存在方式。

2.4 情感丰富、多镜头

Sora 模型对语言有深刻的理解,使其能够准确地解释提示并生成表达生动情感的引人注目的角色。

Sora 还可以在单个生成的视频中创建多个镜头,以准确保留角色和视觉风格。

2.5 复杂场景难模拟、空间细节容易混淆——弱点

Sora 目前难以准确模拟复杂场景的物理特性,并且可能无法理解因果关系的具体实例。例如,一个人可能会咬一口饼干,但之后,饼干可能没有咬痕。

Sora 模型还可能混淆提示的空间细节,例如,左右混淆,并且可能难以精确描述随时间推移发生的事件,例如遵循特定的相机轨迹。

2.6 检测误导内容

Sora 团队还在构建工具来帮助检测误导性内容,例如检测分类器,可以判断视频何时由 Sora 生成。

文本分类器将检查并拒绝违反我们使用政策的文本输入提示,例如那些请求极端暴力、色情内容、仇恨图像、名人肖像或他人 IP 的提示。

还开发了强大的图像分类器,用于查看生成的每个视频的帧数,以帮助确保在向用户显示视频之前,这些视频符合我们的使用政策。

其实这是所有AIGC工具的通病,这个也是合规的重要评判标准之一。

好了,以上就是小编今天带来的所有内容了。想要了解更多资讯就来非凡软件站,快快收藏吧,更多精彩不容错过!

相关文章 最新文章