“机器狗会不会自己去追坏人?”面对这个问题,智元酷拓高管邱恒的回答很直接,现在当然还做不到,因为那并不是一个已经被提前定义好的任务。
这句话折射出当前机器人的真实水平。无论四足机器人还是人形机器人,它们已经能在仓库巡逻、电力巡检、产线搬运等场景中执行某些固定流程,但要像成熟员工那样自主理解环境、临场判断和处理异常,还差得很远。
4月10日,两家机器人企业同步公布进展。智元酷拓带来新一代四足机器人,灵初智能则发布了Psi-R2、Psi-W0模型,并开放首批1000小时人类手部操作数据。无论路线如何不同,行业管理层几乎都提到同一个障碍,高质量真实数据仍然太少。

会按流程做事,不代表会自主工作
对于固定路线的巡逻任务,四足机器人如今已经相当成熟。它们能识别人脸、判断闯入者是否合法、发出语音警告,并把照片或视频同步上传云端。
按IDC数据,2024年全球四足机器狗出货量约2万台,中国厂商已占据明显优势,宇树科技和云深处位居前列。
但邱恒也强调,眼下机器人擅长的是“单步固定流程”。真正复杂的现场任务,比如根据即时环境变化规划路线、追踪一个移动目标、判断该不该绕路或爬台阶,这些能力还不存在于成熟商用系统里。
人形机器人和四足机器人虽然形态不同,但局限相似。前者偏向站立作业和手部操作,后者更擅长移动和搬运,然而它们都离不开事先设定好的规则和路径。中国企业在硬件制造上进步很快,可“大脑”层面的突破没那么容易补齐。
机器人智能为何卡在数据上
业内常把机器人智能控制部分称作“大脑”。这一部分要成长,离不开大量优质真实数据,就像婴儿理解世界,也必须在真实环境里不断学习。
灵初智能联合创始人陈源培认为,最终智能仍然来自数据。但和大语言模型不同,机器人可用的操作和运动数据天然稀缺。互联网上充满了文本和视频,能喂给语言模型;而真实世界里的抓取、移动、协作数据,却很难大量保存和复用。
他提到,行业最早依赖真机采集,后来因为效率太低转向仿真,结果又遇到从模拟环境迁移到真实世界时性能下降的问题,于是大家又重新回到真机和真实场景。只是靠机器人本体去一点点采,规模始终难以快速扩大。
因此,灵初智能尝试通过人类佩戴高性能手套,在真实作业场景下采集操作数据,再把这些数据转化为训练材料。

为什么先去工厂,而不是先进家庭
陈源培坦言,具身智能现在还远没到大语言模型出现GPT-3时那种拐点阶段。技术会进步,但未必像外界想得那么快。
这也决定了机器人更适合先在工业和行业场景落地,而不是直接走进普通家庭。原因很简单,家庭环境变量太多,桌上的纸巾、手机、玩具和杯子都要求机器人作出不同判断,这对智能要求远高于工厂。
相比之下,工业场景规则清晰、流程闭环容易建立,更适合现阶段机器人先完成单点突破。智元、宇树等企业都表达了类似想法,先把电网、煤矿、安防、巡检等To B场景做好,再考虑To C。
中国的优势在于制造业庞大、应用场景丰富,给了机器人一个持续试错和迭代的环境。比如人形机器人已经开始出现在手机生产线,四足机器人也已进入仓库、变电站和消防巡检等任务中。
这些场景不只是在“试用”机器人,也在反过来训练它们。手臂精度不够、电池管理不稳、任务执行偏差等问题,都会通过实际运行不断暴露出来,成为下一轮优化的依据。更重要的是,它们能持续收集真实世界数据,推动机器人“大脑”慢慢发育。
邱恒认为,随着智能提升和成本下降,四足机器人可能会比人形机器人更早形成较完整的商业闭环。但整体来看,机器人产业依旧非常早期,距离真正成为一个能独立应变的“优秀员工”,还有相当长的路。