国产AI电影崛起Sora上线前技术突破
AI 领域迎来颠覆性变革,技术浪潮正以前所未有的速度重塑行业格局。2024 年 10 月 22 日,多家头部 AI 产品同步发布重大更新,标志着人工智能应用进入全新维度:Claude 3.5 模型实现人类行为模拟,可自动执行电脑操作;Runway 推出革命性生成式角色表演工具 Act-One,让普通用户也能创作专业级动画片;Midjourney 即将发布 V7 版本,引入 ControlNet 功能实现图像精准控制;Stable Diffusion 3.5 正式上线,ComfyUI 桌面版也即将推出,更有众多开源视频模型工具蓄势待发。在 Sora 被戏称为”期货”的 8 个月里,国内外 AI 视频领域已涌现出一批创新性产品,各平台竞相争夺行业领先地位。
国产 AI 产品在海外市场异军突起,MiniMax 海螺、快手可灵等品牌凭借高质量输出、高稳定性及影视级制作水准,迅速赢得国际用户青睐。MiniMax 海螺 AI 通过情感演绎实例视频展示惊人能力,仅凭一张图一句话就能生成大师级镜头;快手可灵 AI 联手李少红、贾樟柯等九位知名导演,共同探索 AIGC 电影短片创作。Runway CEO 在最新专访中豪言:”明年或将见证首部 AI 主导创作的电影问世,并斩获奥斯卡奖项。”在此背景下,澎湃新闻对齐 Lab 栏目创新推出首部 AI 非虚构微电影《马兰花开》,影片前 40 秒除航拍镜头外,所有画面均由前沿 AI 技术生成,实现影视级视觉效果,并通过 360°旋转等复杂运镜展现 AI 创作潜力。
AI 功能矩阵如何打造大师级电影镜头?以 360°旋转镜头为例,我们探索了两种实现路径。初期尝试采用”文生视频”直接生成,虽然效果颇具创意,但难以满足精准控制需求。为此我们转向”文生图——图生视频”的中间环节,通过 Stable Diffusion 中的 Flux 模型,结合提示词与参考图生成理想电影画面。首张 360°旋转镜头的构图由此奠定基调,后续运镜环节我们综合考量制作需求、技术可行性及成本因素,选择采用现成视频工具配合单图生成技术。由于当前主流工具单次处理时长限制在 10-12 秒,我们创新性地将镜头拆分为 180°、270°等分段逐步实现,并利用工具的拓展延长功能实现无缝衔接。
AI 发展日新月异,截至 10 月 21 日各大视频工具已推出多项迭代升级。海螺新增”图生视频”功能,Runway 启动 S2.0 和 P2.0 内测版本,为 360°旋转镜头创作带来更多可能。尽管 AI 视频已具备影视化能力,但在细节表现上仍面临诸多挑战。在《马兰花开》制作过程中,AI 对”跳皮筋”等动作的理解存在偏差,直接生成画面会出现语义错误。我们通过提供高清修复后的参考照片,让 AI 学习正确的人物姿态。视频生成阶段同样需要迂回处理,最终采用简化提示词引导 AI 完成动作动势的模拟。
AI 视频创作正衍生出多元玩法。除了影视化方向,Pika 一口气上线 10 种 AI 影视特效,实现溶解、挤压等效果;推特用户 oFaleco 用 AI 实现真·用手抠图,创造次元穿越视觉奇观;Runway 推出视频转绘功能,可根据提示词改变场景风格并保留主体框架。开源社区同样精彩纷呈:ComfyUI 让甜品饮料”活”起来,Liveportrait 将人脸表情移植到动物身上。今年全民健身日,我们用开源技术让十款饮品开启”运动表演”,全国生态日则完成野生动物”街头采访”。
AI 视频创作面临三大核心难题。Runway Meetup 上海分享会上,AI Talk 创始人汗青指出,AI 视频尚未形成适配其特性的新媒介生态。虽然降本增效是明显优势,但当前微短剧、短视频等主流形式已占据用户注意力,AI 视频如何突围成为关键课题。新闻机构更需警惕真实性与 AI 虚构能力之间的矛盾。在《马兰花开》创作中,我们主动放弃还原历史事件方向,既因资料限制又为避免 AI 细节偏差造成误读。
随着 AI 视频产品进入”祛魅”期,主流工具热度出现波动。Similarweb 数据显示,Luma AI 上线后访问量环比下降 38.49%,月访问量仅为 ChatGPT 的 1/413。频繁的版本迭代常伴随排队体验,尚未出现真正改变游戏规则的产品。信达证券研报指出,当前行业风险主要源于底层大模型发展、技术迭代及付费渗透率不及预期。但正如人人都是导演的愿景,这场技术革命或许仍需更多耐心等待。