具身智能厂商正试图加速走进大众。
2025年世界人工智能大会(WAIC)上,各类型机器人的“巡展”和快闪活动,无疑成为最吸引观众驻足的亮点。跳街舞或打拳击、装爆米花或可乐、模拟工厂分拣或流水线工作等展示背后,显示出厂商无一不在展开对具体场景落地的努力和思考。
当然也有现场观众发出疑问:这么慢的运行速度,是否真的能够在商业化场景运作?会跳舞的机器人,到底能满足什么场景需求?
中移智库认为,与上届大会相比,具身智能在技术方面从单模型向多模态跃迁,产品泛化能力和垂直应用均有提升,标准稳步建立,生态不断优化。但此次大会也暴露出具身智能仍面临数据基础不佳、产业卡点淤塞、标准不健全的问题。
21世纪经济报道记者在现场采访发现,对关键零部件的自研能力正成为厂商竞相强调的方向,但如何在其中进行从研发思路到商业化落地的能力再平衡,也是当下要回答的重要议题。
关键自研
从机器人研发角度看,多名从业者都对21世纪经济报道记者表示,旗下产品的目标是更高的自研比例。
一方面,更高的自主化程度可以加速公司内部产品迭代速度;另一方面,自主研发核心元部件达到一定量级,对未来降本量产也将带来帮助。
交银国际就认为,以特斯拉擎天柱机器人为例,其量产时间相比原规划推迟了一年,主要就是受制于零部件供应链不成熟,本体造价过高。该机构指出,按照特斯拉CEO马斯克的规划目标,其核心零部件价值量排序为:六维力传感器—行星滚柱丝杠—谐波减速器—空心杯电机—编码器—无框力矩电机。
从企业的实践来看,深谋科技联合创始人、CEO郑如萍对21世纪经济报道记者指出,“我们认为,针对具身智能体,要进行关键部件打造,目标需要做到软硬件全栈自研。如人形机器人的关节驱动电机对扭矩、响应速度、体积密度要求极高,自主研发核心部件能让硬件设计与软件需求无缝匹配,避免传统‘硬件外购+软件适配’模式中的性能损耗。”
总结来说,全栈自研团队可直接打通‘硬件参数—软件逻辑—场景需求’的反馈链路。例如,当场景部署中发现机器人步态不稳时,机械工程师可调整关节结构,软件工程师同步优化平衡算法,芯片团队甚至能修改底层驱动逻辑,无需等待外部供应商的适配,迭代效率提升显著。
“人形机器人的核心竞争力体现在‘运动精度、响应速度、环境感知、成本控制’等方面,这些都依赖于软硬件协同的底层技术,但这些技术难以通过外购部件简单复制,从而形成独特的竞争壁垒。”她进一步分析。
据悉,在硬件层面,目前深谋科技自主研发了灵巧手、压电式六维力传感器、声表面波传感器,在研准直驱关节模组。
魔法原子销售总监田罡则对21世纪经济报道记者表示,关节模组价格占机器人整机的约40%~50%,因此公司在本月初发布的双足人形机器人MagicBot Z1中,搭载了自研高性能关节模组,有24个基础自由度,最多可扩展至50个自由度;关节最大扭矩超过130N·m。此外,自研了行星减速执行器、谐波减速执行器以及直线执行器,因此可以将核心零部件的自主率做到90%,下一步目标是做到100%自主率。
“关键模组自研后,可以在不同类型产品中快速复用。”他分析道,无论人形机器人形态还是机器狗形态,其中的关键模组都能穿插复用;此外,还能基于此快速拓展新品类。据透露,今年下半年,公司会将产品矩阵进一步扩充。
成本优化
当然全栈自研的道路并不好走,其中最关键的还是核心芯片。郑如萍向记者分析,目前人形机器人“大脑”所用芯片通常有NVIDIA Jetson系列、地平线征程系列等,不同芯片在性能上存在算力不足、功耗较高等局限,但随着商用加速,一旦任务量增大,算力、功耗、成本三者很容易失衡。
而当前特斯拉Dojo芯片集成了CPU、GPU、NPU,在AI推理、视觉处理和运动控制方面有优化,人形机器人的“大脑”芯片未来将朝着提升AI推理效率、强化边缘计算能力、模拟人脑架构等方向发展,以满足机器人在复杂环境中更智能、更高效运行的需求。这也是业界需要努力的方向之一。
在软件层面,她认为更重要的是构建一个世界模型。“个人认为,依赖海量数据的强化学习、大模型等技术,本质上是通过统计规律和模式匹配完成任务,而非真正实现了类似人类的‘理解’能力,并不能真正和人类大脑相匹敌。”她指出,数据驱动的机器人无法理解目标背后的深层意图,这并非否定强化学习、大模型的价值,而是未来还是需要具备因果逻辑和物理关系的通用具身智能世界模型来实现。这也是业界需要努力的方向。
机器人应用落地过程中,成本是绕不过去的坎。郑如萍指出,海外机器人厂商的成本一直居高不下,除了各方面配置较高之外,还有同样的配件国外成本高于国内的原因。
国内厂商则换了一种打法:用国产器件、协同优化算法和结构,能省一颗六维力传感器就省,能用轮式底盘解决的就不用双腿;关节电机、减速器、结构件全部本地化生产,把“够用即可”写进产品定义,先把商业价值跑通,再迭代性能。“当然,挑战在于,某些场景如果节省了六维力传感器,难以形成完整的反馈控制闭环。”她指出。
对于深谋科技自研的关键部件,郑如萍表示,目前市面上以电阻应变式六维力传感器为主,其最早是针对工业场景拿取静态物体用,但未来在场景应用中,与人类互动需要适配高频互动场景,压电式六维力传感器能更好应对这一难题。
声表面波传感器天然适合用在机器人身上,因为它是无线无源的产品,且当前深谋研发的声表面波传感器集成了多物理量参数,如温度、湿度、陀螺仪等,部署在人形机器人上后机器人可以告诉主人,现在环境变化可以及时进行穿衣或调整空调设置,未来还可以将生物化学传感器集成在机器人身上,无痛无创识别人体的病理特征。
探路商用
装爆米花、分拣货品、成为流水线的一环……在WAIC现场,不少机器人都在积极充当打工人角色,引发众多围观。
但也有观众提出质疑:这速度也太慢了,人类分分钟可以完成一大堆工作,机器人还在慢悠悠找准方向。
对此,一名行业从业者对21世纪经济报道记者分析,这本质上是算法和电机等方面的平衡问题。“在算法方面,一些厂商可能担心如果速度过快,可能造成机器人稳定性和安全交付性表现欠佳;电机方面,损耗过多就会产生很高热量。因此这都需要从软硬件方面联合调优。”
不难发现,目前已经在“打工”的人形机器人,率先落地的场景就是工厂,这与工厂环境具备标准化程度高、规模较大的特点有关。备受关注的特斯拉将擎天柱派驻工厂“打工”,实际上也与汽车在多类型传感器,甚至自动驾驶相关能力方面,与人形机器人存在共通性有关。
魔法原子就首次在展台还原了其全尺寸通用人形机器人MagicBot Gen1在工业场景中的落地案例。
田罡对21世纪经济报道记者表示,魔法原子目前在这三个领域有大量订单:工业、商业和教育。
在郑如萍看来,人形机器人商业化将遵循先工业再家用的模式循序渐进,即便目前机器人在流水线上看起来行动效率还有待提高,但能24小时工作的特性可以与之有所抵消。
当然也未必所有工厂场景都适合人形机器人,反而轮式机器人成本较低、同样可以满足部分需求——整体看,实际上今年市场上对人形机器人的需求与去年并没有本质不同。
目前深谋科技主要落地场景为电力和康养。“韩国养老市场是全球老龄化最快、政府补贴最友好的试验田。”她指出,公司已经在韩国与LG、乐天等集团合作,将人形机器人产品落地康养市场,验证可靠性、积累真实场景数据。这也是旗下机器人出海过程中重点打造的典型市场。
“银发经济会是人形机器人有潜力的应用市场,我们将从高中低三档去构建产品体系,通过统一的后台进行数据积累和管理,进而逐步让产品迭代升级。”郑如萍续称。
当然长期来说,她指出,C端市场依然会是未来潜力巨大但也最难突破的市场,因为从安全性、互动性等多方面都要做到体验最优。
郑如萍预计,当硬件成熟度、世界模型泛化能力与法规伦理框架都就位时,人形机器人才会逐渐敲开普通家庭的大门。中短期来说,预计2027年市场上会有较高需求出现,2028年人形机器人将逐渐进入家庭场景。