大家好我是二狗。

就在今天,据推特大V“小互”分享,Sora的完整能力曝光,根据OpenAI 申请的SORA™商标注册描述显示:

除了众所周知文生图和文生视频之外,Sora还具备多模态图像视频理解能力—— 对视频和图像进行识别、处理、分析、理解。

Sora完整能力曝光!多模态视频理解或成为下次爆点_模态

下面是SORA™商标注册描述截图:

Sora完整能力曝光!多模态视频理解或成为下次爆点_人工智能_02

OpenAI 总是处处抢先一步

Sora 模型文生视频的强大,大家都见识到了。

下面是 Sora 模型生成的鲜花老虎漫天飞舞的视频。

而这次 Sora 模型暴露出来的多模态图像视频理解能力就很值得人玩味。

毕竟此前几天,Sora 模型正是在谷歌发布拥有多模态视频理解能力的Gemini 1.5之后几个小时才发布的。

Sora 模型的多模态视频理解或成为下次爆点。

同时这正是 OpenAI 的宣发理念——气死对手,永远占领用户心智。

前几日,据昆仑万维创始人周亚辉剧透,OpenAI将很快发布GPT4.5,而且估计会故意选择 Anthropic 发布Claude 3的时候发布。

Sora完整能力曝光!多模态视频理解或成为下次爆点_人工智能_03

Sora模型离不开中国??

就在OpenAI发布Sora 模型改变世界的时候。

在国内,竟然有报道称Sora关键原材料之一来自于一家绵阳公司:

Sora完整能力曝光!多模态视频理解或成为下次爆点_人工智能_04

网友们纷纷开启了吐槽模式:

Sora完整能力曝光!多模态视频理解或成为下次爆点_模态_05

Sora完整能力曝光!多模态视频理解或成为下次爆点_人工智能_06

Sora完整能力曝光!多模态视频理解或成为下次爆点_模态_07