2025AI中场战事:巨头围剿新贵谁主沉浮
国内AI大模型市场正经历从”百模大战”到淘汰整合的中场阶段转型。经过2023年以来的激烈竞争和资本热潮,行业格局逐渐明朗,形成了新老巨头与新兴独角兽两大阵营并立的局面。
曾经群雄逐鹿的百模战场已经洗牌,如今舞台由百度、字节跳动、阿里、腾讯等老牌巨头与阶跃星辰、智谱AI、DeepSeek等新晋独角兽主导。这些巨头与独角兽在模型创新、算力投入、生态布局、开源策略等方面各显神通。与此同时,”AI六小龙”的处境出现明显分化,部分企业已开始收缩战略。
自ChatGPT问世仅两年,从300家大模型同台竞技的巅峰时期,洗牌至以月之暗面、MiniMax、智谱、阶跃星辰、零一万物、百川智能为代表的”大模型六小龙”。这些曾雄心勃勃追赶OpenAI步伐的企业,如今面临巨头势力的全面加持、技术门槛和成本壁垒的不断提升,生存空间正被不断挤压。
新一轮AI攻势催生了一批规模庞大的玩家。字节跳动、阿里等巨型互联网公司纷纷加大投入,各自布局大型AI中台和应用生态。新崛起的阶跃星辰、智谱AI、DeepSeek等明星创业团队也加入了这场角逐。如今战线已从前沿算法逐步向商业化与生态落地转移,价格战与应用场景争夺成为新的焦点。
一、高筑墙,广积粮,新老BAT凶猛
在这场AI博弈中,巨头阵营的攻势尤为猛烈。字节跳动稳扎稳打,近年推出的豆包系列模型在多模态理解与生成上持续突破。最新发布的豆包通用模型(Doubao-Pro)已与GPT-4系列性能看齐。字节针对不同场景不断优化模型结构,今年公布的视觉理解模型和种子级文本、语音、音乐等专用模型,使其在多模态任务上保持领先。更重要的是,字节对AI商业化投入巨大,豆包系列在公司内部50多个业务场景中大规模上线,日调用量突破4万亿tokens,7个月增长33倍。为抢占市场,字节还大幅降价,力推”厘时代”。2024年5月,豆包通用模型首度对外发布时定价仅0.0008元/千token,比行业均价低99.3%;年底再推视觉理解模型,价格仅0.003元/千token,比行业价低85%。这一轮降价风暴迅速形成正向循环,底层算法实力加上亿级用户生态(抖音、头条、飞书等),使豆包迅速覆盖千行百业。字节通过开放开发平台”扣子”集聚开发者,目前已有百万活跃开发者参与构建了200万智能体,全面铺开AI应用生态。综合技术实力、资金、生态三者,字节已成为AI赛道的领跑者之一,其打法可总结为”更强模型+更低价格+更易落地”。
阿里作为开源最早、最完整的大公司,在AI投入上同样坚决。通义团队累积开源200多款模型,涵盖千问(Qwen)大语言模型和万相(Wan)视觉生成模型两大基座系列。4月底发布的最新”千问家族”Qwen3系列模型,包含0.6B至235B规模的多款模型,并完全开源。Qwen3小模型(4B参数)可达上一代Qwen2大模型效果,整体在多模态和推理上有显著提升。阿里云服务端也积极降价抢市场,2024年已将多款大模型推理价格砍至原价的3%左右,并计划2025年继续降价。阿里通过开放模式与巨额补贴双管齐下,一方面开放底层模型吸引全球开发者,另一方面下调成本激发生态活力,展现了持续投入的决心。
腾讯在大模型领域的战略持续进化。4月份,腾讯对其混元大模型研发体系进行全面重构,围绕算力、算法和数据三大核心板块,刷新团队部署,加码研发投入。调整后成立两个新部门:大语言模型部和多模态模型部,分别负责探索大语言模型和多模态大模型的前沿技术。腾讯官方人士表示,此举旨在优化研发流程、整合资源,应对大模型时代日新月异的挑战。此前,腾讯已将元宝、ima、QQ浏览器、搜狗输入法等AI产品线整合,提出”核心自研+拥抱开源”策略。混元模型多模态性能强劲,今年推出的”快思考”Turbo S模型和”深度思考”T1模型在公开基准上达业界领先水平;在视觉、3D生成领域,腾讯也开源了多款模型,在GitHub上收获近3万星标。混元模型已深度嵌入微信、QQ等产品,通过腾讯云向外输出能力。值得注意的是,腾讯2024年研发投入达707亿元,创下历史新高,为其大模型技术攻关提供雄厚后盾。在中场博弈中,腾讯凭借底层算法实力、开源影响力和全域生态输出,构筑了独特的防线和进攻点。
百度在2025上半年持续加码大模型研发与开源,以”文心大模型”4.5系列为核心,先后推出并免费开放ERNIE 4.5和深度思考X1,性能在多模态理解和推理能力上全面超越同级竞品,Turbo版本将推理成本分别降低至0.8元和1元/百万Token。文心一言平台自4月全面免费后,用户规模迅速攀升至4.3亿,日均调用量突破15亿次。未来ERNIE 5.0的推出,预计在多模态融合与推理效率上进一步革新。在产品与生态层面,百度已将大模型能力深植搜索与智能助手,上线”AI搜”智能检索服务和通用智能体App”心响”,覆盖知识问答、文档处理等百余场景,并通过开放API吸引开发者创新。
二、新锐突围,基础大模型格局再洗牌
除了”新老BAT”,一些大模型初创企业同样展开全面进攻。上海独角兽阶跃星辰作为新兴力量,近年动作频频。2024年末完成B轮融资数亿美元,由上海国资领投、腾讯等战略投资者跟投。官方披露,融资将继续用于核心大模型研发,特别是强化多模态和复杂推理能力,并通过产品生态渗透C端市场。今年2月,阶跃星辰开源发布了其性能最强的两款多模态模型:”Step-Video-T2V”拥有300亿参数,能生成204帧、540P高质量视频;”Step-Audio”在多项公开语音评测中超越同类开源模型。成立不到两年、团队500余人的阶跃星辰,在迭代了11个模型后跻身”AI六小虎”行列,被《麻省理工科技评论》评为”中国值得关注的四家AI创业公司之一”。公司高管透露,团队中算法和技术人员占比近八成,创始人姜大昕为微软前高管、IEEE Fellow入选者,首席科学家张祥雨为ResNet论文合著者。这些”高密度人才”正支撑阶跃星辰在多模态技术上的狂飙突进。
来自清华学府的智谱AI也高速扩张,并已启动上市进程。今年4月,智谱AI正式在证监局备案辅导(中金公司为辅导机构),成为国内首家进入IPO流程的大模型创业公司。智谱AI自2019年成立以来专注认知智能大模型研发,与学术机构合作打造了中英双语千亿参数预训练模型GLM-130B,并基于此推出对话模型ChatGLM及其开源版本ChatGLM-6B。除通用模型外,智谱还推出了多模态和行业应用组件:AI助手”智谱清言”、高效代码生成模型CodeGeeX、视觉语言理解模型CogVLM、文生图模型CogView等。商业模式上,智谱主张”模型即服务(MaaS)”,已建成AI开发开放平台,为政府和企业提供私有化部署和智能体解决方案。据官方介绍,其MaaS平台已支持百万量级开发者,与全球多家车厂、终端厂商合作,将大模型从”聊”引向”行”。凭借深厚学术背景与产业合作,智谱AI正力图成为”基座模型”领域的领军企业。
DeepSeek的声音同样不容忽视。DeepSeek团队虽低调,但技术打法极具冲击力。专注于语言模型,尤其是数理逻辑能力,并秉持开源策略。今年春节发布的DeepSeek-R1模型,以远低于常规的算力投入,实现了与GPT-4等顶级模型媲美的性能。业内分析认为,DeepSeek在训练方法上的创新才是关键:其采用的Mixture-of-Experts架构使模型参数总量达6710亿,但运行时只激活37亿参数,大幅降低计算需求;多Token预测和”潜注意力”等技术也极大提升效率。DeepSeek走的是偏科研的路线,不急于变现,团队以顶尖新秀为主、规模精简,将更多资源投入算法优化。正因如此,一经开源便引爆关注,其App已突破3000万日活,成史上最快登顶的AI应用之一。投资者与同行也纷纷围拢,众多业内人士重新审视DeepSeek的技术实力,私募纷纷尝试接触其创始人梁文锋。DeepSeek通过极致的工程优化与开源创新,已悄然建立起自己的竞争优势。
三、退守与聚焦,AI六小龙瓦解
相比之下,”AI六小龙”的处境出现明显分化。以李开复创办的零一万物为例,2025年初曝出要将预训练团队出售给阿里的传闻。尽管李开复辟谣称并非出售,但他已承认”目前只有大厂能持续投入超大规模模型训练”。公司大幅调整方向,主动与阿里云合作成立”产业大模型联合实验室”,将预训练算法团队和基础设施团队交给阿里,专心做小参数高性价比模型。他坦言:”我们不再做超大模型,不是因为不相信Scaling Law,而是把这件事交给能做的大公司来做,我们跟他们合作,这才是生存之道”。零一万物开始放弃自行训练万亿参数模型,转向针对电商直播、会议等场景的行业智能应用,推出AI数字人和”Yi”系列服务。虽未立刻倒闭,但其已清晰地从”造基座”往后撤步,调整为聚焦落地应用。
百川智能也显示出战略调整迹象。2024年7月宣布完成50亿元A轮融资,估值约200亿元,投资方包括阿里、腾讯、小米等互联网巨头。百川主打医疗方向,大模型”百川-53B”于2023年底问世,AI助手”百小应”上线,曾在2024年WAIC展台展示医疗问诊应用。而今年3月,就有媒体爆出,百川两位联合创始人已确认离职。股权回购与融资并购也传出争议。王小川在内部信中提到,公司两年来战线拉得太长、不够聚焦,已裁撤部分ToB金融部门,将重心回归医疗专家模型和百小应产品。可见百川虽获得资金支撑,维持产品更新和生态拓展,但内部正在精简业务以求聚焦。
月之暗面近期明显收紧打法,缩减烧钱战略。春节后有媒体披露,在DeepSeek攻势之下,月之暗面决定大幅压缩市场推广预算,暂停多款安卓渠道投放并解除第三方广告合作。公司内部将此归因于”外部环境变化和战略调整”,表明其营销打法将更加谨慎。此前,月之暗面曾以广撒网的方式重点推广AI助手Kimi,也在海外推出Ohai、Noisee等产品。但根据晚点财经报道,月之暗面今年9月已决定停止Ohai和Noisee的运营,将资源集中在核心产品Kimi。有两位负责海外产品的高管离职创业,创办了定位于AI编程的公司。这些动向与资本市场的谨慎形成对照,不难看出,这家曾估值近25亿美元的独角兽在战术上更加聚焦,降低了非核心业务拓展的投入。
MiniMax的路径选择显得既谨慎又富有张力。这家曾因创始团队出身商汤而备受瞩目的公司,早期凭借Talkie这类情感陪伴类应用快速打开海外市场,日交互量一度突破30亿次,但如今却面临用户增长乏力、留存率下滑的困境。当赛道瓶颈逐渐显现,MiniMax继而调整策略,逐渐淡出同质化严重的情感陪聊红海,转而将资源向视频生成、音乐创作等更具技术壁垒的领域倾斜。MiniMax作为国内首个自主研发MoE混合专家架构的团队,早已不满足于单一模态的较量,而是构建起覆盖文本、语音、图像、视频的全矩阵模型体系。产品布局上,MiniMax采取ToB与To C双线并进的策略。ToB端通过开放平台接入3万家企业,覆盖客服、教育等标准化场景以降低边际成本;To C端则依靠星野、Talkie等情感陪伴应用积累日均30亿次交互数据,但面临用户增长放缓、付费能力有限及海外监管风险。近期推出的海螺AI试图以文生视频、音乐生成等特色功能突破同质化竞争,但渗透率仍需提升。今年3月,MiniMax虽获6亿美元A+轮融资,旗下Talkie应用日交互量超30亿次,却仍未找到稳定盈利模式。尽管有大量资金注入且产品有一定用户活跃度,但MiniMax在盈利模式上尚未取得突破,目前仍在不断尝试和调整,以在竞争激烈的市场中找到可持续发展的道路。
总的来看,AI创业”小龙们”的走势已有显著差异,但这种趋势并非败退,而是行业成熟期必然的理性回调,最终目标是在巨头夹缝中守住”小而美”的生存空间。相反,以字节、阿里、腾讯为首的重量级玩家由于资金、人才、生态和数据积累优势,正处于中场竞赛的主动位置。未来谁能在”智能上限”和”多模态能力”上取得突破,还有待考验。但可以肯定的是,这场”中场战事”已经由此前的狂飙突进转向稳扎稳打的比拼,各路玩家都在砥砺技术、优化策略,一方面力图保留优势,一方面寻求新的成长路径。要知道,”大模型的路要跑得清楚,最终还得落到产品上”,谁能走得更久、更稳,将决定这场AI竞赛的下一阶段格局。