Sora之后中国AI视频生成牌局:企业跟进策略与行业迷雾解析

Sora,自2月16日由OpenAI发布以来,一直被外界戏称为“技术期货”,饱受争议。然而,在12月10日,正式版Sora终于揭开面纱,其能够生成最高1080p分辨率、最长20秒的视频,标志着视频生成领域的重大突破。OpenAI CEO奥特曼更是将其誉为视频生成领域的“GPT-1时刻”。然而,与GPT时期国内AI企业迅速跟进不同,中国AI企业在视频生成领域展现出更为复杂的态度,呈现出多元化的发展态势。

Sora之后中国AI视频生成牌局:企业跟进策略与行业迷雾解析

国内AI企业在面对Sora时,主要分为三类:明确跟进、坚决不跟和浅尝辄止。字节跳动、快手、腾讯等互联网公司以及智谱AI、MiniMax等AI公司纷纷发布了自己的视频生成模型,宣称达到或超越了预览版Sora的性能。而百度、百川智能等企业则明确表示不会跟进Sora,认为其商业化前景不明朗,且更专注于大语言模型和多模态大模型的发展。此外,还有大量企业出于“恐惧错过”的心理,对Sora进行了初步布局,但并未投入大量资源。

Sora之后中国AI视频生成牌局:企业跟进策略与行业迷雾解析

那么,国内对标Sora的模型究竟在做什么?Sora的核心技术路线是结合Diffusion和Transformer,通过文本、图片、视频作为提示词进行视频生成。对标Sora的模型至少要具备通用性、高质量和强一致性等特点,能够生成任意内容的视频,且画质精度高、视频时间长、画面一致性强。

Sora之后中国AI视频生成牌局:企业跟进策略与行业迷雾解析

国内企业在面对Sora时,不再像ChatGPT推出时那样毫无准备,但选择也呈现出明显的分化。第一类是明确跟进的企业,如字节跳动的即梦Dreamnia、快手的可灵大模型以及腾讯的混元大模型等。第二类是坚决不跟的企业,如百度和百川智能等。第三类是浅尝辄止的企业,如阿里妈妈的tomoVideo、月之暗面的视频生成模型以及零一万物的B端业务视频生成模型等。

Sora之后中国AI视频生成牌局:企业跟进策略与行业迷雾解析

为什么到了Sora,大模型行业的游戏规则就变了?国内科技企业的表现说明,对于Sora存在非共识,整体还是比较混乱、规则模糊的阶段。迷雾中的领域,游戏规则自然只能自行探索。如今视频生成领域的现状,笼罩着三重迷雾:技术迷雾、商业迷雾和竞争迷雾。

Sora之后中国AI视频生成牌局:企业跟进策略与行业迷雾解析

技术迷雾方面,OpenAI认为Sora是世界模拟器、通往AGI的一条有前途的途径,但这一技术路线目前存在不少争议。李飞飞、Lecun等人认为,Sora不能实现AGI,因为其仍是二维图像,只有三维空间智能才能实现AGI。即使是正式版Sora,也依然存在手部细节不准确、动态过程中的一致性等问题。国内公司坚定不跟进Sora的原因之一,也是对这一技术路线保留意见。

Sora之后中国AI视频生成牌局:企业跟进策略与行业迷雾解析

商业迷雾方面,视频生成模型的商用前景、投资回报比,在短期内都不明朗,成为劝退国内企业的另一重阻碍。预览版和正式版Sora,都延续了OpenAI的“暴力美学”,通过堆算力、对数据、对参数量的方式,来尝试让大模型涌现出理解物理世界的能力。这种方法成本高、资源投入大。是否跟进Sora,就取决于各家对模型的商用预期和投资回报比。如果视频生成模型面向ToB收费,通过API或SaaS服务,都需要基础模型厂商投入大量人力去优化业务流程、开发交互页面,而影视行业正处于调整周期,AI影视制作业务的增长有限。这就在无形中增加了AI企业的机会成本,因为同样的人力、物力、算力,投入到金融AI、教育AI、大型政企等领域,显然收效更大。所以,百度、零一万物等公司,都将视频生成领域作为边缘业务,并不重点投入。

Sora之后中国AI视频生成牌局:企业跟进策略与行业迷雾解析

竞争迷雾方面,虽然视频生成模型现在商业前景不明,但有没有可能以后会爆发,企业悄悄投入然后惊艳所有人?这种押注边缘赛道“捡大漏”的商业神话,在大模型身上恐怕很难发生。当前,大模型的产品化、商业化前景普遍比较模糊,通用模型厂商都需要尽快从一大堆不甚明朗的产品中,选出一个更高成功概率和更大市场潜力的选项,重点投入。而在所有产品中,视频生成模型是一个尤为沉重且具有挑战性的项目。这种情况下,肯定要优先考虑成功率更高的产品,降低视频生成模型的业务优先级。换一个角度,即便企业将视频生成模型的优先级放到最高,恐怕也很难建立起竞争优势。因为当前大模型的市场竞争情况跟GPT时期不太一样,如今各家在基础训练设施、核心架构设计与技术储备等方面都有了一定积累,复现Sora并上线类Sora应用的技术壁垒,其实没有ChatGPT时期那么难了。这也意味着,即使企业先发布了视频生成模型,也未必能长期保持竞争优势和市场垄断地位,这种竞争态势也削弱了Sora的商业想象空间。

Sora之后中国AI视频生成牌局:企业跟进策略与行业迷雾解析

技术迷雾、商业迷雾、竞争迷雾,仍然笼罩在视频生成领域,导致Sora这一场牌局有着太多的不确定,和太多可能。哪种理解是对的,哪条路线是最终赢家,目前都言之过早,各家只能按照自己的游戏规则玩下去。大模型技术必须继续发展下去,但从Sora开始,国内科技企业不再紧跟着OpenAI亦步亦趋,开始有了自己的节奏感。具体表现在,对于Sora这样一鸣惊人的新东西,国内企业在大模型产品化、商业化上都有了自己的理解与思考,开始自己定义玩法,跟进Sora展现的是实力,不跟进Sora展现的是心态与战略定力。此外,不一味跟进产品,但OpenAI的叙事能力仍然值得学习。无论是2月用Sora抢走谷歌风头,还是近期Sora正式上线,OpenAI总能一次次带动节奏、设置议题、吸引关注,这对于资本密集型AI企业是非常重要的能力。可以不跟进Sora,但不能遗漏关键技术。以百度为例,虽然没有推出Sora产品的计划,但自身也没有缺席关键技术,比如自研了多模态可控生图技术,能够在保持实体特征不变的情况下,实现图像的高泛化生成,而可控性的提升,恰恰是视频生成下一阶段核心中的核心。此外,百度也没有完全无视视频生成领域,目前投资了视频生成初创公司生数科技、AI视频短剧公司井英科技等聚焦主赛道,以自身核心业务、商业优先级等多元因素来确定追赶Sora的轻重缓急。大模型的牌局,国内企业正在找到自己的节奏感。

Sora之后中国AI视频生成牌局:企业跟进策略与行业迷雾解析

Sora之后中国AI视频生成牌局:企业跟进策略与行业迷雾解析

Sora之后中国AI视频生成牌局:企业跟进策略与行业迷雾解析

Sora之后中国AI视频生成牌局:企业跟进策略与行业迷雾解析

Sora之后中国AI视频生成牌局:企业跟进策略与行业迷雾解析

Sora之后中国AI视频生成牌局:企业跟进策略与行业迷雾解析

Sora之后中国AI视频生成牌局:企业跟进策略与行业迷雾解析

文章网址:https://www.wpbull.com/ai/2122.html