腾讯AI视频生成对决Sora同提示词效果测评
腾讯版Sora迎来重大进展,相关视频生成模型与产品正经历紧张的升级与调试阶段。虽然正式上线时间尚未确定,但幸运的内测用户已率先体验其强大功能,让我们抢先一探究竟。
作为腾讯首款文生视频模型,混元在展示大熊猫吃竹子的场景时表现出色,尽管竹子略显干瘪,整体画面流畅自然。鱼儿在水中自由游弋、小狗在公园追逐蝴蝶的画面同样生动逼真。更令人惊叹的是,混元甚至能生成游戏风格的画面,创意全凭用户想象。
多镜头生成功能同样亮眼。一位男士从光鲜亮丽的着装瞬间转变为破旧风格,两位食客品尝九转大肠时发现带馅儿而露出咬牙切齿的表情,这些场景切换流畅自然,充满戏剧张力。AI视频生成技术的一大期待,便是理解物理世界的模型。混元在这方面也展现了不俗实力,例如一只大象站在漂浮于蓝色水面白色床单上踱步的场景,既展现了物理上的矛盾感,又通过床单褶皱细节巧妙化解,令人玩味。
与Sora的较量刚刚开始。近期Sora的泄露版本再次引发广泛关注,然而从亮相至今仅10个月,AI视频生成赛道已风云变幻。除了百度明确表示不参与竞争,字节、快手、阿里、腾讯等国内大厂纷纷布局,国内大模型六小龙中已有四家推出视频生成模型或产品。腾讯混元文生视频能否在如此激烈的竞争中脱颖而出,还有待正式版发布后的市场检验。
尽管如此,我们仍可基于现有信息与Sora进行初步对比。在相同提示词下,混元与Sora的表现如何?让我们拭目以待。
Round1:经典场景再现
提示词:一只金毛寻回犬在白雪皑皑的德国追逐一只猫
腾讯混元与Sora的呈现效果如何?
Round 2:超现实场景挑战
提示词:一个特写镜头,展示了一个内部有禅宗花园的玻璃球。球中有一个小矮人,正在耙禅宗花园并在沙子中创造图案。
面对现实中不存在的场景,混元与Sora又将如何演绎?
Round 3:长篇复杂提示词解析
动画场景特写了一个短毛绒怪物跪在融化的红蜡烛旁边。艺术风格为3D写实,注重光线和纹理。这幅画的氛围充满了惊奇和好奇,怪物睁大眼睛张着嘴巴注视着火焰。它的姿势和表情传达出一种纯真和俏皮的感觉,仿佛它是第一次探索周围的世界。暖色调和戏剧性的光线运用进一步增强了画面的温馨氛围。
在长篇复杂提示词的考验下,混元与Sora的创造力与细节处理能力将面临怎样的挑战?