京东将推AI数字人“千人千面”具身智能技术引领未来
近日京东在”具身智能”领域的布局引发广泛关注,集团已正式成立相关业务部门并展开技术攻关。3月初京东探索研究院发布重要研究成果,其开发的高扩展性具身智能系统架构,已成功应用于咖啡机器人等家庭场景,通过双臂灵巧手的一体式高频率遥操技术,以及基于末端模仿的泛化操作方法,实现了80%的成功率。这套系统突破了传统实验室场景的局限,标志着京东在具身智能领域取得重大突破。
针对近期备受热议的”具身智能”话题,3月25日京东科技人工智能负责人向WpBull.comAGI表示,京东云正持续深耕大模型技术并加速产业应用落地。该负责人指出,发展通用人工智能(AGI)需从三个方向推进:首先是发展大语言模型;其次是实现多模态能力,让大模型具备视觉甚至触觉等感知能力;最终是走向”具身智能”,将AGI从数字世界延伸至物理世界。在京东看来,随着硬件制造技术的成熟,软件即智能模型将成为机器人领域的核心竞争力。京东将重点聚焦机器人与大模型的深度融合,探索世界模型、深度推理模型等新应用场景,最终实现机器人可执行、可操作的”具身智能”。
京东探索研究院成立于2020年10月25日,作为集团技术发展的核心平台,整合全集团资源专注于人工智能、数据科学等前沿科技领域。该研究院致力于从基础理论层面实现颠覆式创新,助力数智化产业发展。近年来京东加速技术转型,2017至2024年累计研发投入超过1400亿元,2024财年研发支出更是创下170.31亿元的历史新高。得益于此,京东AI技术已深度应用于物流和零售场景,成功推出多款智能仓储、分拣机器人。
2024年底京东云峰会发布了三大智能平台和五大技术产品,其中言犀数字人3.0成为亮点。该数字人已全面接入DeepSeek技术,目前已有200余家品牌使用DeepSeek辅助生成直播脚本,文案参考率达90%。数据显示,采用言犀数字人的品牌数量同比增长200%以上,GMV增量超140亿。作为京东云的核心技术代表,言犀数字人率先实现了规模化产业应用。
在荣誉方面,京东科技人工智能团队凭借”多模态交互式数字人关键技术及产业应用”项目荣获2024年度吴文俊人工智能科学技术奖特等奖。该技术突破主要体现在三个方面:低成本高保真人体建模、语义一致多模态应答、多模态自然化行为生成。如今京东言犀数字人技术再度升级,其通用的基座大模型通过语音合成大模型LiveTTS及通用数字人大模型LiveHuman,仅需输入自然语言或1秒视频/照片,即可生成4K超高清、口型匹配度达100%、声纹还原度98%的数字人,彻底改变了传统数字人制作模式。
据负责人透露,京东言犀数字人正在布局”千人千面”功能,预计今年4月上线。该功能将为每个商家和用户打造个性化直播助手,实现更精细化的消费者服务。负责人强调,当前数字人技术发展已超越单纯算法或数据问题,关键在于算法工程优化。
放眼行业,腾讯领投智元机器人B轮融资,蚂蚁集团成立蚂蚁灵波科技专注具身智能研发,华为在深圳成立全球具身智能产业创新中心。国泰君安证券研究所认为华为在人形机器人领域可能采取”卖铲人”模式。可以预见,未来国内科技大厂将在制造业、医疗、家庭服务等具身智能潜力领域展开激烈竞争。
展望未来,京东将持续优化具身智能技术并拓展新应用场景。通过整合”视觉-语言-动作”大模型与预训练强化学习方法,提升机器人操作成功率和泛化能力。负责人表示,最终目标是打造真正服务于人类的机器人,例如让机器人能识别咖啡种类和杯子大小自动倒咖啡。从某种意义上说,世界都是为人而生的。