Sora完整能力曝光！多模态视频理解或成为下次爆点

原创

夕小瑶谈人工智能 2024-03-04 15:31:48 ©著作权

©著作权归作者所有：来自51CTO博客作者夕小瑶谈人工智能的原创作品，请联系作者获取转载授权，否则将追究法律责任

大家好我是二狗。

就在今天，据推特大V“小互”分享，Sora的完整能力曝光，根据OpenAI 申请的SORA™商标注册描述显示：

除了众所周知文生图和文生视频之外，Sora还具备多模态图像视频理解能力—— 对视频和图像进行识别、处理、分析、理解。

Sora完整能力曝光！多模态视频理解或成为下次爆点_模态

下面是SORA™商标注册描述截图：

Sora完整能力曝光！多模态视频理解或成为下次爆点_人工智能_02

Sora 模型文生视频的强大，大家都见识到了。

下面是 Sora 模型生成的鲜花老虎漫天飞舞的视频。

而这次 Sora 模型暴露出来的多模态图像视频理解能力就很值得人玩味。

毕竟此前几天，Sora 模型正是在谷歌发布拥有多模态视频理解能力的Gemini 1.5之后几个小时才发布的。

Sora 模型的多模态视频理解或成为下次爆点。

同时这正是 OpenAI 的宣发理念——气死对手，永远占领用户心智。

前几日，据昆仑万维创始人周亚辉剧透，OpenAI将很快发布GPT4.5，而且估计会故意选择 Anthropic 发布Claude 3的时候发布。

Sora完整能力曝光！多模态视频理解或成为下次爆点_人工智能_03

就在OpenAI发布Sora 模型改变世界的时候。

在国内，竟然有报道称Sora关键原材料之一来自于一家绵阳公司：

Sora完整能力曝光！多模态视频理解或成为下次爆点_人工智能_04

网友们纷纷开启了吐槽模式：

Sora完整能力曝光！多模态视频理解或成为下次爆点_模态_05

Sora完整能力曝光！多模态视频理解或成为下次爆点_人工智能_06

Sora完整能力曝光！多模态视频理解或成为下次爆点_模态_07

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯