华为天才少年新创公司发布具身基座大模型引领机器人未来
“稚晖君”彭志辉,这位曾以201万年薪加入华为的”天才少年”及智元联合创始人兼CTO,近日在微博放出重磅预告:”下周智元机器人有好东西发布”。3月10日上午,备受瞩目的消息正式揭晓——智元机器人发布全球首个通用具身基座模型:智元启元大模型GO-1(Genie Operator-1)。该模型基于Vision-Language-Latent-Action(ViLLA)框架,创新性地融合VLM(多模态大模型)与MoE(混合专家)架构,展现出采训推一体、小样本快速泛化、”一脑多形”跨本体应用、持续进化及人类视频学习等革命性优势,通过整合人类与多机器人数据,为机器人赋予前所未有的学习能力。这一突破性发布迅速引爆行业热议,#华为离职天才少年官宣刷屏#、#稚晖君或再掀机器人行业风暴#等话题强势登顶微博热搜。
在3月10日上午的沟通会上,智元具身研究中心常务主任任广辉向钛媒体AGI透露,智元机器人已成功量产下线1000台机器人。他强调,Go-1基于通用数据训练,具备极强的泛化能力,即便在零数据条件下也能快速适应新场景、新任务,且部署成本极低。任广辉指出:”具身智能正迈向通用化、开放化与智能化,将彻底走出实验室,拥抱开放世界。”智元机器人合伙人、研究院执行院长姚卯青进一步阐释,公司对AI技术的战略级投入坚定不移,今年将启动规模化生产交付,而不会将研发成本转嫁至终端售价。他认为,在智元启元大模型GO-1的加持下,智元机器人正迈入G3-G4发展阶段,既能高效完成特定任务,又逐步具备通用能力。”若机器人企业不发展大模型,将失去未来——没有智能化的硬件只是有限功能的机械装置。”姚卯青强调,AI能力将成为区分机器人产品竞争力的核心要素,随着硬件方案逐渐收敛,供应链高度整合,最终比拼的将是AI能力,这对机器人落地与自主作业至关重要。
智元机器人成立于2023年,作为国内人形机器人赛道领军企业,其创始人之一”稚晖君”彭志辉是拥有250万粉丝的B站UP主。公司成立不到1个月便完成天使轮融资,年内斩获4次融资,6个月推出首款人形机器人,2024年发布五款商用新品,去年底开源百万真实机器人数据集,年初率先实现1000台机器人量产,持续引发行业震动。截至目前,智元机器人已完成天使轮、A1、A1+等多轮融资,累计募资超16亿元。其产品线涵盖远征、Genie和灵犀三大系列。
当前具身模型普遍面临泛化性差、新任务依赖大量数据、跨本体数据无法共享、模型无法持续进化等困境。DP/ACT等具身小模型技能单一,GR-1/2等模型在场景感知、指令理解等方面存在语义泛化局限。而智元启元大模型GO-1开创性地提出ViLLA架构,这是全球首个基于大规模自有数据、自主训练并部署的机器人基座模型。该架构由VLM+MoE组成:VLM通过海量互联网图文数据获取通用场景感知与语言理解能力,MoE中的Latent Planner借助跨本体人类操作视频数据实现通用动作理解,Action Expert则通过百万真机数据掌握精细动作执行能力。三者协同运作,既支持人类视频学习,又实现小样本快速泛化,显著降低具身智能门槛,已成功部署于智元多款机器人本体。
Genie Operator-1具备五大核心特点:采训推一体化无缝衔接数据采集、模型训练与推理;小样本快速泛化极大降低后训练成本,零样本即可适应新场景;一脑多形通用策略模型可跨本体快速适配;持续进化通过数据回流系统从实际执行中持续学习;人类视频学习结合互联网视频与真实示范增强对人类行为的理解。据智元公布,GO-1平均成功率较现有最优模型提升32%(46%→78%),在倒水、清理桌面、补充饮料等任务中表现尤为突出。智元表示,该模型为机器人替代人类完成生活工作场景提供了强大”大脑”,从家庭备餐、办公接待到工业操作,都能快速实现智能化应用,推动具身智能从单一任务向多元场景、从封闭环境向开放世界、从预设程序向指令泛化加速跨越。
任广辉还透露,智元已与阶跃星辰达成深度合作,将后者多模态、推理训练及工程化能力赋能机器人。姚卯青预测,AI大模型将助力机器人加速进入工厂、零售、服务业等场景,长期有望走进家庭。”这才是机器人价值充分释放的时刻。”谈及备受关注的9.9万元机器人,姚卯青直言该产品仅具备基础运动能力,在技术尚未收敛时打价格战无意义,呼吁行业关注产品竞争力,否则将扰乱健康发展。他判断,人形机器人将在1-2年内实现局部工业场景落地,进入家庭需5年左右,而具备类人通用物理世界AGI能力则需5-10年。据钛媒体AGI独家获悉,智元计划2025年第二季度推出强化学习仿真模型,下半年将发布X2等商用机器人及”灵巧手”等新技术,全力冲刺2025年10倍营收目标。