阶跃星辰CEO姜大昕:两年16款多模态模型,DeepSeek证实投流模式不成立
阶跃星辰CEO姜大昕于5月8日向WpBull.comAGI透露,公司将在未来两到三个月内,即7至8月发布满血版推理模型Step R1,同时未来数月还将推出更先进的Step图片编辑模型。姜大昕强调,模型的突破将优先于商业化进程,并指出”多模理解生成一体化”是阶跃星辰构建世界模型的关键路径,旨在逐步迈向智能涌现、AI Agent及通用人工智能(AGI)的领域。
在谈及C端投流策略时,姜大昕对WpBull.comAGI表示,DeepSeek的案例已证明传统投流逻辑的局限性。”DeepSeek的经验告诉我们,投流的逻辑实际上是不成立的,因为ChatGPT虽未进行大规模推广,但若放开流量,其用户规模突破一亿毫无悬念。这要求我们重新思考AI时代的产品增长模式,不应再依赖传统互联网式的投入驱动。”姜大昕进一步指出,DeepSeek、哪吒、黑悟空神话等AI产品均展现出类似特征,并非依靠铺天盖地的资源投入实现增长。
姜大昕认为,AI Agent智能体的爆发需要多模态和慢思考能力的双重支撑,而2024年这两个领域均取得了突破性进展。”多模态能力是Agent输出的必备要素。”他强调,模型的”理解生成一体化”是计算机视觉领域亟待突破的瓶颈。所谓GPT-4时刻,正是指AI模型在模态层面真正达到人类智能水平的关键节点。因此,阶跃星辰的终极目标是构建”世界模型”。”AGI路线的清晰化趋势日益明显,虽然视觉领域的基础问题尚未完全解决,但一旦突破,未来道路将更加顺畅。”姜大昕表示。
阶跃星辰成立于2023年4月,作为行业领先的通用大模型创业公司,始终致力于探索实现通用人工智能(AGI)的道路。公司已对外发布Step系列基座大模型矩阵,秉持”智能阶跃,十倍每一个人的可能”的使命,坚持自研超级模型,积极布局算力、数据等关键资源。微软前全球副总裁姜大昕担任创始人兼CEO,ResNet作者之一的AI科学家张祥雨、拥有丰富大规模集群与系统建设经验的AI系统专家朱亦博等顶尖人才相继加入。
在融资方面,阶跃星辰于2024年12月完成B轮融资,总金额达数亿美元,核心投资方包括上海国有资本投资有限公司及其旗下基金,战略和财务投资人涵盖腾讯投资、五源资本、启明创投等。产品层面,成立两年间,公司已累计发布22款自研基座模型,覆盖文字、语音、图像、视频、音乐、推理等全系列,其中16款为多模态模型,占比超七成,在行业内被誉为”多模态卷王”。多模态模型矩阵涵盖图像理解、视频理解、图像生成、视频生成、图像编辑、音乐生成等,全部处于行业领先水平。
产业应用层面,阶跃星辰聚焦智能终端Agent,已在汽车、手机、具身智能、IoT等关键场景与行业头部企业达成深度合作。今年1月,公司发布Step R-mini,成为Step系列的首款推理模型,进一步拓展了大模型能力边界;2月,宣布开源文生视频/图生视频模型Step-Video-T2V/TI2V,并与吉利汽车集团、千里科技、OPPO、智元机器人、TCL等企业展开合作,同时发布全新升级的”繁星计划”2.0;进入5月,公司宣布与ACE Studio联合开源3.5B版本音乐大模型ACE-Step,并与灿星文化战略合作,推动AI与娱乐产业的深度融合。
姜大昕指出,多模态是实现AGI的必经之路。他进一步阐释:”AGI对标的是人类智能,而人类智能具有多元化特征,不仅包括语言符号智能,还包括视觉智能、空间智能、运动智能等,这些都需要通过多模态学习获得。因此,在多模态领域任何方向的短板,都将延缓AGI的实现进程。”
谈及AI技术发展方向,姜大昕提出三个预测:1、预训练基础模型结合强化学习,可激发模型推理时的长思维链能力,显著提升推理水平;2、视觉领域实现理解生成一体化,通过单一模型完成理解与生成任务,确保生成内容的价值与意义;3、基于ChatBot App等应用产品,逐步进化至智能体(Agent)阶段。”我相信智能体终将走出数字世界,进入物理世界,逐步应用于智能驾驶、人形机器人等领域。”姜大昕认为,当前汽车辅助驾驶VLA仍是简单预测模型,缺乏推理能力,而真正的VLA应具备类似人类大脑的action分布预判机制。
智能终端Agent是阶跃星辰的核心发力领域。姜大昕强调,Agent的首要任务是更好地辅助人类完成任务,需要理解用户所处的环境和任务情境。许多终端设备如手机、AI眼镜、AI耳机等,可视为人体器官的延伸,能够收集环境信息,帮助模型更全面地理解用户上下文。姜大昕特别看好AI眼镜的发展前景,认为人形机器人的泛化能力仍需长期发展。
关于坚持基础大模型研发的原因,姜大昕从两个层面进行说明:一、当前AI技术行业趋势和需求极为旺盛,技术发展日新月异,公司需要顺应这一趋势坚持基础模型研发;二、从应用角度看,模型与应用相辅相成,模型决定应用上限,应用为模型提供具体场景和数据支持,这是至关重要的。
谈及C端盈利空间,姜大昕表示,阶跃星辰通过端侧AI Agent服务实现商业化,最终服务于消费者。在多模态领域,姜大昕指出,海外xAI第一梯队如OpenAI和Google的隐藏实力强大,需要时间爆发;国内AI产品更注重理解领先性或专注单一领域如AI视频生成,而阶跃星辰的独特之处在于既研发基础模型,又在代际层面推动应用落地。
总结而言,姜大昕强调三个关键点:一、公司坚持基础大模型研发,追求AGI是初心且不会改变;二、在当前竞争格局中,阶跃星辰的多模态能力具有差异化优势,性能领先,且前沿方向存在巨大机遇;三、在应用层面,公司选择差异化路线,携手合作伙伴在智能终端AI Agent方向发力,构建从模型到Agent、从云上到端侧的完整生态体系。