韩歆毅详解蚂蚁AI战略布局 聚焦应用侧探索AGI
5月27日下午4时许,新任蚂蚁集团CEO韩歆毅身着黄色短袖,亲临杭州蚂蚁A空间,现场观摩正在进行的”蚂蚁黑客松”比赛。这位年仅87天便执掌蚂蚁集团的年轻领导者,选择坐在前排台阶上,专注聆听团队的创新成果。韩歆毅于今年3月从清华大学经济学硕士升任蚂蚁集团CEO,在他的带领下,蚂蚁集团正加速推进三大战略:支付宝双飞轮、AI First和全球化布局。
事实上,蚂蚁集团与其他互联网巨头一样,近年来持续加码AI领域投入。去年蚂蚁集团20周年之际,董事长井贤栋曾公开宣告,未来二十年将致力于打造一家科技驱动、创新驱动的企业。在AI First战略指引下,蚂蚁已推出金融、医疗、生活服务三大AI应用,内部业务也全面加速AI化转型。值得注意的是,蚂蚁内部成立了通用人工智能(AGI)部门,并开源了参数规模达2900亿的百灵大模型,引发业界广泛关注。
在27日下午举行的第十届蚂蚁技术日上,韩歆毅首次系统阐述了蚂蚁的AI战略布局。他用了整整三十分钟,清晰勾勒出蚂蚁未来在AI领域的战略方向。韩歆毅坦言,当前中国AI大模型赛道竞争异常激烈,蚂蚁将聚焦AI应用层面,依托AI基座大模型技术打造更强大的技术服务能力。”我们永远在AI技术突破的边界上打造PMF产品,技术路线必须收敛才能实现产品突破;一旦路线明确,我们就敢于持续投入。”韩歆毅强调,”虽然我们聚焦AI应用,但绝不放弃基础大模型研发。因为只有基于AI技术构建服务和应用,才能像训练智能体一样提升其能力上限,从而提供更优质的服务。我们坚定探索AGI和智能极限。”
韩歆毅指出,AI时代将重新定义各行各业。蚂蚁集团即将开源两款重磅AI模型:一款与DeepSeek-V3性能比肩的MoE大模型,以及一款百亿级多模态模型。这两项成果源自蚂蚁百灵大模型团队(Ling Team)的持续突破。今年3月,该团队开源了两个MoE架构大语言模型:参数规模168亿的Ling-lite(0220版本)和参数规模高达2900亿的Ling-plus。这两个模型在多个算力平台(包括非Hopper架构的国产算力)上完成训练,预训练阶段将计算成本降低约20%,每万亿token训练成本仅为508万元,最终实现了行业顶尖模型的性能表现,并验证了300B尺寸SOTA MoE大模型在非高端算力平台上的训练可行性。
与此同时,蚂蚁强化学习AReaL团队开源了AReaL-boba模型,该模型可用128张H800 GPU在1天内完成SOTA 1.5B推理模型训练,256张H800 GPU仅需2天即可完成SOTA 7B推理模型训练。经过数月迭代,Ling-lite已升级至1.5版本,其推理能力显著提升。新模型在同等参数规模下,仅用2.75B激活计算即可对标10B内SOTA dense模型。Ling-lite-1.5采用分层语料预训练策略和需求驱动的执行优化体系,以更少语料实现更高质量,大幅提升数学、代码等推理能力。
5月27日,蚂蚁百灵大模型团队宣布将逐步开源百亿参数规模的多模态模型Ming系列Ming-lite-omni。这款模型以统一架构集成多模态理解、生成和编辑能力,既可合并调用理解与生成模块,也可独立完成单一任务,实现原生全模态交互体验。Ming-lite-omni继承了Ming-lite-omni-preview和Ming-lite-uni两款模型的能力,并在此基础上进行了系统优化。基于Ling-lite-1.5架构,该模型新增模态特定路由机制,有效缓解模态冲突,增强模态间协同,使音、视、图、文等模态能够统一处理。在图像、语音生成与理解方面,Ming-lite-omni着重突破理解与生成相互冲突的技术难题,实现了模态统一处理和多模态理解与生成在一个模型上的统一,可处理任意组合的多模态输入,生成音频、图像或文本交织的多模态输出,从而实现先进的实时全模态交互体验。
团队表示,逐步开源Ming系列多模态模型旨在营造协作环境,让研究人员和开发者基于这些模型进行创新,推动AI应用发展。通过社区合作,蚂蚁希望加速Ming系列模型开发,构建更先进实用的AI系统。百灵大模型负责人周俊(花名:西亭)指出,新开源的Ming-lite-omni模型具有三大创新点:一是真正将生成和理解模型集成于同一架构;二是实现全模态输入输出,支持音视频、图文等多种形态;三是采用MoE架构,交互性更强。多模态大模型负责人陈景东(景东)补充说明,目前开源的更多是必要代码,其核心作用是帮助开发者充分利用Ming系列模型。当前,包括蚂蚁、腾讯在内的多家AI大模型团队认为,多模态模型正朝着MoE架构的”全模态”模型演进。Seed1.5-VL和Qwen2.5-Omni等模型已支持图像、视频、语音、文本及其任意组合的理解,而Kimi-VL等模型则采用MoE架构;但在技术挑战上,支持音、视、图、文全模态交互的公开单模型仍属罕见,图像和语音理解与生成统一模型更是屈指可数,且效果难以平衡。阿里集团副总裁许主洪认为,多模态大模型的一大演进趋势是用统一框架实现理解和生成,这一领域尚处初级阶段,需要更多实践验证。蚂蚁开源的Ming-lite-omni正是这一领域的代表性实践。
同时,蚂蚁宣布百灵大模型即将开源一款Ling-max模型,其规模和性能将与DeepSeek-V3″满血版”相当。蚂蚁逐步形成了两类百灵基础模型路线:MoE语言大模型Ling-Series/推理模型Ring-Series;原生全模态大模型Ming-Series。在模型更新之外,蚂蚁三大AI管家应用也取得新进展。旗下AI健康管家即将上线新版本。今年初蚂蚁集团完成收购好大夫后,3月首次公布以蚂蚁医疗大模型为核心的”一体三端”AI医疗布局,成为应用场景与行业共建最深的专业大模型之一。自去年下半年发布以来,AI健康管家通过高质量数据资源和专业标注团队持续优化,在AI就医助理、AI健康咨询等方面表现优异,已为超4000万用户提供了个人日常健康管理与就医咨询服务。
对于内部AI产品使用百灵大模型的情况,西亭表示,蚂蚁之所以开源众多基础模型,是希望打破大模型垄断,通过将探索的AI技术公布到开源社区,推动大模型发展。从业务和应用角度看,百灵不会强行绑定,因为当前模型尚未达到AGI能力,也未成为社会必需品。行业和基础模型双方将持续推进,但不会过度耦合。”我们更期待合作伙伴纯粹因为百灵技术优秀而选择我们,而不是其他应用连接使用百灵模型。这是我们对内对外的关键原则。”西亭强调,”我们希望做的东西能够获得社区认可,并推动AI技术进步。”关于AGI,西亭表示仍处于早期阶段,蚂蚁相信随着模型能力提升,会在合适时机通过内部和外部应用实现AGI。
随着国内AI竞争加剧,蚂蚁正加速发力AI应用。自2025年起,全球AI大模型市场将进入”内卷”阶段。开源模型DeepSeek引发全球讨论,但基础大模型迭代并未放缓,除DeepSeek外的AI行业Super App也未出现。国内外科技大厂都在加速模型迭代:OpenAI发布GPT-4.5和o3;Gemini发布2.5 Pro版本;腾讯混元升级快思考模型混元TurboS、深度思考模型混元T1,并发布视觉深度推理模型T1-Vision和端到端语音通话模型混元Voice;字节跳动旗下火山引擎发布豆包·视频生成模型Seedance 1.0 lite、豆包1.5·视觉深度思考模型,并升级豆包·音乐模型等。去年第四季度国内有49个大模型更新发布,今年一季度增至55个,最多时一周有8个模型。大模型迭代速度加快,能力增强,正如李彦宏所言”大模型厂商卷生卷死”。因此,如何利用强大模型做好AI应用,让更多人体验AI技术能力,将成为未来关键。国内科技大厂凭借基本盘产品、流量资源、投入和人才优势,将成为国内AI”下半场”竞争的核心参与者。韩歆毅表示,与创业公司相比,蚂蚁的优势不在于资源,而在于人才,关键是如何将人才凝聚起来,这需要协作。
韩歆毅坦言,AI领域充满挑战,蚂蚁正在与全球顶尖AI团队竞争,对方不仅在起点上领先,发展速度也更快。因此,蚂蚁的目标不是成为全球最领先的大模型公司,而是继续聚焦应用,通过智能上限探索实现AI应用突破,”至少在几个领域我们要保持领先。”
在首次详细阐述的新AI First战略中,韩歆毅提出了三大AI应用服务:AI金融管家、AI健康管家、AI生活管家;四大技术探索方向:百灵基础大模型、AI世界的支付与基础能力、科技产业化、开源与开放;两大行业探索领域:AI与物理世界融合(具身智能)、区块链。关于基础模型探索,韩歆毅表示,蚂蚁团队近几个月投入巨大,已在某些方向取得全球领先地位,但仍是单点突破。未来将全力以赴追求智能上限,并持续开源开放。另一方面,随着AI世界日益多样化,蚂蚁的机会在于支付,AI世界的支付可能与今天完全不同,因此需要提供AI世界的支付与基础能力。对于具身智能探索,韩歆毅指出,这是一个面向未来的开放式探索。今年蚂蚁成立灵波科技,将探索AI与物理世界的融合,未来还将与哈啰共同探索自动驾驶。”人在相当长的时间内,不太可能回到科幻电影中的虚拟世界,但现实世界和数字AI世界将长期并存,我们希望帮助大家解决现实AI世界问题,这就是我们探索具身智能、智能驾驶等的原因。”韩歆毅强调。
韩歆毅表示,蚂蚁AI First战略是一个”顶层框架型”构想,具体业务和策略仍在探索中。无论是解决当前业务问题还是面向未来探索,都需要技术人员创新突破。”技术是我们产品和业务快速发展的核心能力。”韩歆毅强调,蚂蚁希望为用户和合作伙伴提供革命性、代际差体验,核心竞争优势。在AI技术探索和应用战场上,蚂蚁要回归”黑客松”精神,源于对技术的热爱。”我们源于热爱,成于协同,最终用创新为蚂蚁未来十年、科技未来十年开辟新天地。”韩歆毅在演讲结尾总结道。