Sora与国产视频模型对比:效果评测与深度分析
AI大模型工场中的Sora模型已正式上线一周,尽管其研发周期长达近一年,但用户对其仍抱有高度期待。然而,上线初期服务器便遭遇崩溃,用户使用体验并不理想,实际效果也未能完全满足预期。不少用户抱怨,20美元的会员费花得并不值得,生成的视频效果甚至不如国产的灵犀AI和即梦AI。难道Sora真的“起个大早,赶了个晚集”?为了探究真相,AI大模型工场也购买了会员,旨在对比Sora与国产模型的实际表现。行动胜于空谈,让我们通过实测来揭开谜底。
### 编辑板块新亮点
Sora此次最大的亮点在于,在文、图生视频的基础功能之上引入了多种高级编辑功能。以下是Sora更新的编辑功能及其视频表现:
1. **Remix(重混)**
用户可以使用Remix替换、删除或重新构想视频中的元素。例如,视频中的门和场景都可以被轻松替换或删除,为创作提供极大灵活性。
2. **Re-cut(重新剪辑)**
通过找到并分离出最佳帧,向前或向后延伸,从而完成新场景的构建。用户只需挑选合适的视频帧,即可重新拓展视频场景的叙事空间。
3. **Storyboard(故事板)**
在时间线上组织和编辑视频的独特序列,精确控制分镜头的发展,帮助用户讲述更连贯的故事。
4. **Loop(循环)**
使用Loop剪辑并创建无缝循环的视频,适用于需要重复播放的场景。
5. **Blend(混合)**
将两个视频合并为一个无缝剪辑,实现平滑过渡。
6. **Style presets(风格预设)**
使用预设风格创建和分享创意视频。目前支持五种风格:Balloon World(气球世界)、Stop Motion(定格动画)、Archival(档案材料)、Film Noir(黑白电影)、Cardboard & Paper(纸工艺品)。
### Sora VS 国产模型:文生视频实测
本部分从文生视频的角度对比Sora与可灵AI、腾讯元宝、即梦AI的表现。我们使用相同的Prompt在不同模型中生成视频,观察其效果差异。
#### 1. 圣诞探戈场景
**Prompt**:美丽圣诞场景,一对探戈舞者正在跳探戈。
**Sora**:生成的动作略显僵硬,缺乏优雅,似乎未能理解探戈舞的精髓。
**可灵**:生成的圣诞场景和人物跳舞场景协调一致,人物肢体自然,动作连贯,表现优于Sora。
**即梦**:动作上虽力求优雅,但人物手部细节处理不佳,女士的手显得无处安放。
**腾讯元宝**:生成的场景充满迪士尼梦幻感,人物动作幅度较小,但手指等细节未变形,氛围感十足,但AI感较重,缺乏真实感。
#### 2. 浪漫樱花场景
**Prompt**:美丽的春日东京城市熙熙攘攘。相机穿过繁华的街道,跟随几个人享受樱花天气并在附近摊位购物。绚丽的樱花花瓣在风中飞舞。
**Sora**:语义理解明显不足,未表现出漫天樱花,人物头部变形严重,衣服搭配也显得不协调。
**可灵**:生成的樱花场景梦幻,具有日漫街头风,但花瓣过大,像玫瑰花瓣。
**即梦**:语义理解同样不足,未展现樱花效果,人物面部识别模糊。
**腾讯元宝**:樱花场景和人物表现良好,镜头转场自然,唯一一个体现出摊位购物场景,镜头切换流畅。
#### 3. 猫咪捕猎场景
**Prompt**:猫在住宅区奔跑,以猫的视角看脚下有草坪,其他猫躺着,似乎瞄准鸟儿。
**Sora**:镜头前有糊感,奔跑姿势一般,未能完全理解语义,未体现住宅区、鸟儿等元素。
**腾讯元宝**:猫咪呈现状态忽隐忽现,镜头角度粗糙,语义理解不足。
**即梦**:语义理解较好,场景中小鸟、其他猫咪表现精准,猫咪镜头语言强烈。
**可灵**:场景和镜头表现全面,包含所有文本元素,猫咪动作和表情自然,无变形。
### 总结
尽管Sora在编辑功能上确实有许多亮点,如故事板概念,但其模型能力未能跟上,表现明显不如国产模型。当前国内AI视频产品竞争激烈,各大厂商都在不断优化,随手可应付的时代已经过去。除了模型能力,用户更关注交互、门槛、性价比等因素。Sora目前无论从哪个角度对比,都缺乏足够优势。
Sora的算法独特,但尚未展现其上限。官方生成的成品图虽惊艳,但用户在实际操作中仍面临诸多壁垒,尤其是操作门槛较高,阻碍了新用户的使用。关键词和功能面板操作复杂,语义理解也不够精准。
综合来看,Sora虽有其亮点,但在实际应用中仍需改进,才能在竞争激烈的市场中脱颖而出。