您现在的位置是:首页 > 置顶轮播图822*450 >
具身智能人形机器人冲刺商用
2025-05-28 10:15:09作者:杨光来源:中国信息化周报
摘要 当前,具身人形机器人产业呈现出一种冰与火并存的博弈状态。一方面,技术突破、厂商入局、资本涌入,整个行业热火朝天;另一方面,实际 ...
全球科技竞合的“关键领域”
人形机器人半程马拉松赛事,萌态百出,笑声不断。有的机器人走起“猫步”,将引导员“好好走线”的告诫当耳旁风,直接冲向绿化带;有的机器人狠狠摔了一跤,头都摔掉了;还有的机器人不管有没有人关注,一直边走边挥手,像是来刷存在感的,把比赛抛之脑后,将我行我素演绎到极致;这些看上去有点“智障”的人形机器人,怎样才能跑得快,更聪明地互动?不仅需要有大长腿、低配重、高颜值,除了拥有更轻的材料、更高效的电池、更坚固灵活的关节外,“具身智能”必须发挥重要作用。
具身智能是机器人产业棋局中的关键一子。赛场上人形机器人的众生百态,映射出产业发展的现状,也将推动具身智能技术“走向”更成熟的阶段。
比赛跑步只是开始,让机器人为人服务,能够智能互动、从事繁重的劳动,才是目的。人形机器人在步入运动时代后,下一个阶段将走向何方?
“人形机器人即将开启生产力时代。”在第19届中国投资年会年度峰会上,北京大学助理教授、银河通用机器人创始人兼CTO王鹤判断。毋庸置疑,人形机器人正从运动时代向生产力时代过渡,具身智能在中间发挥着重要作用。
具身智能:万亿元蓝海市场
“具身智能机器人已成为继电脑、手机、电动汽车之后的新一代智能终端,可形成万亿元蓝海市场。”中国工程院院士、湖南大学教授王耀南表示。
发展具身智能具有重要的意义。中国工程院院士、中国科学院沈阳自动化研究所研究员于海斌指出,具身智能不仅代表技术革新,更标志着思维方式的转变。具身智能注重智能体与环境互动,推动感知、行动与认知的深度融合,为人工智能发展开辟新道路。
千寻智能联合创始人高阳认为,具身智能是指机器人能够通过身体与环境的交互来执行各种任务,帮助人类完成各种工作。他表示:“10年后,10%的人会拥有自己的机器人,帮人类做各种各样自己不想做或者懒得做的事情,这是我认知的具身智能。”
具身智能的概念由“人工智能之父”图灵在1950年首次提出,核心在于将感知、行动与认知深度融合。
具身智能(EmbodiedArtificialIntelligence,简称EAI)是指智能体通过物理实体与环境实时交互,实现感知、认知、决策和行动一体化。
具身智能框架
安徽大学校长、自主无人系统技术教育部工程中心主任孙长银表示,具身智能是人工智能与机器人深度融合的产物,可以理解为AI(人工智能)、Body(身体)、Control(控制)、Decision(决策)的融合,凝聚为EnbodiedAI(具身智能)。孙长银表示,从人类的智能到具身智能都需要具备ABCDE框架。
中国工程院院士、清华大学教授戴琼海表示,具身智能已成为我国培育未来产业的重要方向以及全球科技竞合的“关键领域”。从科学研究的角度看,具身智能为理解人类智能的本质提供了新视角。通过研究智能体在环境中的行为,可以更深入地了解人类感知、认知和行动的机制,从而推动认知科学、神经科学等相关学科的发展。
从技术应用的角度看,具身智能在工业、医疗、教育等领域具有广泛的应用前景。随着人工智能技术的不断发展和创新,具身智能的应用场景将不断拓展,为各行各业带来了前所未有的变革和机遇。
“具身智能的概念相对宽泛,自动驾驶汽车也属于具身智能的范畴。而人形机器人是一种典型的具身智能,旨在实现人类能够从事的各种工作,即成为通用机器人。”北京银河通用机器人有限公司市场部相关负责人武文韬表示。具身智能强调智能体与环境的动态互动,而人形机器人因其类人形态和多功能性,成为具身智能技术落地的理想载体。具身智能是人形机器人的核心技术支撑。
技术迭代周期极速压缩
有人说这些人形机器人自带滑稽细胞,一定程度上缓解了工作岗位要被替代的焦虑;但目前人形机器人距离代替人类工作,还有很多障碍需要跨越。
“智能产业仍面临认知推理的困境。”上海交通大学特聘教授、人工智能研究院副院长马利庄表示,“人物行为的意图理解以及智能体的行为预测成为智能化瓶颈,容易引发严重安全事故。其核心问题是缺乏空间场景深度理解、缺少多步推理逻辑链、动作规划与环境反馈脱节。”
“具身智能企业迭代周期从年度缩短至季度。中国企业起步晚但发展速度更快,正快速追赶上国际巨头。中国具备人才+供应链+场景优势,极有可能跑出世界级具身智能企业。只有具备世界级算法、硬件及商业化能力的企业,才可高效触及具身智能上限。”千寻智能战略生态副总裁孙荣毅表示。我国拥有领先算法人才优势,人才云集,并在具身智能领域取得了卓越成果。同时,我国坐拥成熟供应链,依托全球最完整制造业供应链体系,可以实现最低成本、最高效率的生产制造。此外,得益于第二第三产业增长,我国拥有丰富场景与数据,能够有效产生真实数据,为算法研发和迭代提供有力支撑。这些优势共同构建了中国在该领域的核心竞争力。
“比企业的迭代速度更快,具身智能技术与产品的迭代已经达到以周为单位。”武文韬表示。
数据获取和标注成本高是当前面临的主要挑战之一。高质量的多模态数据是训练自然语言交互模型的基础,但数据的获取和标注成本较高,且数据的多样性和完整性不足。为突破数据瓶颈,银河通用利用10亿级合成数据训练的端到端具身大模型,实现了人形机器人手眼脑协调的突破,使其能够像人类一样在复杂环境中执行各种任务。银河通用特别采用了自研仿真合成数据技术管线,能让机器人在抓取等任务上获得超越95%的成功率。这种方法的训练成本远低于人工动作捕捉或者遥控操作。
不同于银河通用以低成本和高泛化能力见长,适合复杂环境下的通用任务;千寻智能通过灵活的数据策略和柔性操作能力,聚焦于多任务连续性和场景定制化。千寻智能Spiritv1具身分层大模型采用数据金字塔训练策略。以海量互联网视频预训练学习人类操作常识为基底,叠加少量场景化数据后训练与微量真机强化学习,仅需百条真实数据即可实现新任务泛化。相较而言,合成数据无法完全覆盖真实场景中的所有细节,需通过后训练进一步优化;而互联网视频数据对特定行业场景的适配性有限,也需要进一步完善。
“过去两年,具身智能行业在复杂任务能力、模型迭代效率和硬件成本方面取得了显著进步,实现了执行复杂任务能力3倍增长、高频动作控制和消费级价格。”千寻智能战略生态副总裁孙荣毅说。千寻智能在具身大模型技术方面取得了显著突破。通过端到端的VLA(视觉-语言-动作)具身大模型,实现了机器人在非结构化环境下的多任务连续泛化能力。例如,机器人能够在复杂环境中完成叠衣服、冲泡咖啡、桌面整理分拣等任务,展现出较强的适应性和灵活性。在强化学习和模仿学习领域,高阳提出EfficientZero算法,在Atari基准测试上达到了人类性能的109%,其样本效率首次超越了人类的水平,达到了经典强化学习算法DQN数据效率的近600倍。EfficientZero解决了强化学习领域的重大基础科学问题,填补了国际高效率强化学习领域的空白,这也是迄今为止,样本效率最高的强化学习算法。
千寻智能Spiritv1具身大模型其核心架构包含三大模块,VLM(视觉语言模型)+具身大模型+MPC(模型预测控制)。VLM负责任务拆解,如将“整理仓库”分解为“识别货物-规划路径-抓取摆放”;具身大模型生成动作轨迹;MPC则实时调整关节力矩,应对突发碰撞。这一设计使Moz1在陌生环境中的任务完成率提升60%。
冰与火的博弈:规模应用处于待催化状态
当前,具身人形机器人产业呈现出一种“冰与火”并存的博弈状态。一方面,技术突破、厂商入局、资本涌入,整个行业热火朝天;另一方面,实际应用场景有限,商业闭环尚未形成,产业发展仍处于破冰阶段。
技术突破如同星星之火
在技术层面,具身人形机器人领域可谓是烈火烹油。以波士顿动力的Atlas机器人为例,其惊人的运动能力展示了具身智能的巨大潜力。
国内企业也不甘示弱,穹彻具身大脑以两个大模型为基础,具备规划、记忆、执行这三种核心能力,可以完成给人刮胡子、给黄瓜精细削皮等能高难度任务;天工人形机器人可以通过实时视觉感知行走,还具备高速奔跑和强抗干扰能力,能够在雪地、沙地等复杂环境中稳定运行,奔跑时速可达12公里;宇树科技的机器人则在平衡和体操动作上表现出色。这些技术突破,如同星星之火,点燃了人们对具身人形机器人未来的无限憧憬。众多企业也纷纷投身这片蓝海,为行业注入了强大的活力,推动了技术的快速迭代和产品的不断升级。
资本的涌入,更是为这把火添了一把柴。各大投资机构纷纷押注具身人形机器人赛道,巨额资金的注入,加速了技术研发和产品落地的进程。
应用场景的“冰封”状态
然而,与火热的技术、厂商和资本形成鲜明对比的,是应用场景的“冰封”状态。目前,具身人形机器人主要应用于科研、展览等场景,真正落地的商业应用屈指可数。高昂的成本、有限的续航、复杂的操作,都成为阻碍其大规模应用的冰山。商业闭环的缺失,是另一座难以融化的冰山。尽管一些企业尝试将具身人形机器人应用于物流、服务等领域,但尚未形成成熟的商业模式。如何将技术优势转化为商业价值,是整个行业亟待解决的难题。高精度力矩传感器、谐波减速器等核心部件成本占比超60%。如何破解硬件成本魔咒?只有聚焦核心技术路线,集中资源突破关键技术瓶颈,才能实现规模效应,进而激发边际成本递减的潜力。“在人形机器人尚处于早期阶段的今天,我们作为一家技术链路全栈的公司,优先发展基于低成本、高稳定性的轮式机器人,快速推动机器人在无人值守药店、工厂等场景的应用。”武文韬说。
售价在多大范围内,才更有利于企业级用户大规模应用?武文韬表示,价格并不是企业用户关注的重点。如果能够帮企业解决劳动力短缺的问题,企业愿意为此买单。“对于面向企业的B端市场,如车厂,机器人解决方案的稳定性是其首要关注点,远超价格因素;而对于面向消费者的C端市场,未来机器人价格应该会下降到与汽车相当的水平”。
“少踩坑、高效花钱”
如何寻找最佳的商业化路径?“我们坚持在真正有商业价值的场景中实现数据和商业的闭环。”千寻智能产品副总裁耿旭达总结,要少踩坑、高效花钱。目前,千寻智能研发的具身大模型Spiritv1已具备多项技能,在多场景、多对象中均可实现泛化,在制造业和服务行业取得了显著进展,并与龙头企业建立了合作关系,完成了方案设计和部分数据采集与模型训练。
据武文韬介绍,银河通用计划在1至3年内将人形机器人应用在商业场景,而将机器人应用于复杂工厂环境则需要一定时间的准备和测试,走进千家万户则需要更长的时间,预计将是5年以上。“因为家庭场景更加复杂、对高技能的要求更高,是人形机器人应用中最具挑战性的环境”。
目前,银河通用已在北京落地由人形机器人值守运营的24小时无人药店,并计划于今年推广至一线城市,并逐步扩展到全国。该款机器人可以完成从接单到找药、拿药、装袋等一系列流程,打包好交给快递员,能够胜任药店、超市、工厂配料仓等场景。
作者手札
认知革命的黎明
工业和信息化部新闻发言人、运行监测协调局局长陶青在工业和信息化发展情况发布会上表示,今年一季度,在提振消费专项行动、“两新”加力扩围等相关政策的带动下,新能源汽车、智能制造装备等行业的内需潜力进一步激发,工业机器人、服务机器人产量达到14.9万套和260.4万套,同比分别增长26%和20%。
可以看出,在政策的推动和需求牵引的双轮驱动下,工业机器人和服务机器人产量大幅增长,应用将进一步深化。当具身智能突破“感知—行动”闭环,向“预测—创造”进化时,人类将见证真正的智能革命。银河通用、千寻智能等企业正站在历史转折点:他们不仅需要攻克毫米级的抓取精度、感知能力提升、决策系统优化等难题,更要解决人机共生的哲学命题。曙光乍现,这场从实验室到产业化的长征,已经开始,或将重塑未来三十年的生产力图景。
(本文不涉密)
责任编辑:王艳
上一篇:聚焦绿色微电网 探索零碳发展路径
下一篇:国品崛起