www.haiwaiwai.com机器人开始走进工厂，但距离“好员工”还有多远

机器人开始走进工厂，但距离“好员工”还有多远

“机器狗会不会自己去追坏人？”面对这个问题，智元酷拓高管邱恒的回答很直接，现在当然还做不到，因为那并不是一个已经被提前定义好的任务。

这句话折射出当前机器人的真实水平。无论四足机器人还是人形机器人，它们已经能在仓库巡逻、电力巡检、产线搬运等场景中执行某些固定流程，但要像成熟员工那样自主理解环境、临场判断和处理异常，还差得很远。

4月10日，两家机器人企业同步公布进展。智元酷拓带来新一代四足机器人，灵初智能则发布了Psi-R2、Psi-W0模型，并开放首批1000小时人类手部操作数据。无论路线如何不同，行业管理层几乎都提到同一个障碍，高质量真实数据仍然太少。

AMP

会按流程做事，不代表会自主工作

对于固定路线的巡逻任务，四足机器人如今已经相当成熟。它们能识别人脸、判断闯入者是否合法、发出语音警告，并把照片或视频同步上传云端。

按IDC数据，2024年全球四足机器狗出货量约2万台，中国厂商已占据明显优势，宇树科技和云深处位居前列。

但邱恒也强调，眼下机器人擅长的是“单步固定流程”。真正复杂的现场任务，比如根据即时环境变化规划路线、追踪一个移动目标、判断该不该绕路或爬台阶，这些能力还不存在于成熟商用系统里。

人形机器人和四足机器人虽然形态不同，但局限相似。前者偏向站立作业和手部操作，后者更擅长移动和搬运，然而它们都离不开事先设定好的规则和路径。中国企业在硬件制造上进步很快，可“大脑”层面的突破没那么容易补齐。

机器人智能为何卡在数据上

业内常把机器人智能控制部分称作“大脑”。这一部分要成长，离不开大量优质真实数据，就像婴儿理解世界，也必须在真实环境里不断学习。

灵初智能联合创始人陈源培认为，最终智能仍然来自数据。但和大语言模型不同，机器人可用的操作和运动数据天然稀缺。互联网上充满了文本和视频，能喂给语言模型；而真实世界里的抓取、移动、协作数据，却很难大量保存和复用。

他提到，行业最早依赖真机采集，后来因为效率太低转向仿真，结果又遇到从模拟环境迁移到真实世界时性能下降的问题，于是大家又重新回到真机和真实场景。只是靠机器人本体去一点点采，规模始终难以快速扩大。

因此，灵初智能尝试通过人类佩戴高性能手套，在真实作业场景下采集操作数据，再把这些数据转化为训练材料。

AMP

为什么先去工厂，而不是先进家庭

陈源培坦言，具身智能现在还远没到大语言模型出现GPT-3时那种拐点阶段。技术会进步，但未必像外界想得那么快。

这也决定了机器人更适合先在工业和行业场景落地，而不是直接走进普通家庭。原因很简单，家庭环境变量太多，桌上的纸巾、手机、玩具和杯子都要求机器人作出不同判断，这对智能要求远高于工厂。

相比之下，工业场景规则清晰、流程闭环容易建立，更适合现阶段机器人先完成单点突破。智元、宇树等企业都表达了类似想法，先把电网、煤矿、安防、巡检等To B场景做好，再考虑To C。

中国的优势在于制造业庞大、应用场景丰富，给了机器人一个持续试错和迭代的环境。比如人形机器人已经开始出现在手机生产线，四足机器人也已进入仓库、变电站和消防巡检等任务中。

这些场景不只是在“试用”机器人，也在反过来训练它们。手臂精度不够、电池管理不稳、任务执行偏差等问题，都会通过实际运行不断暴露出来，成为下一轮优化的依据。更重要的是，它们能持续收集真实世界数据，推动机器人“大脑”慢慢发育。

邱恒认为，随着智能提升和成本下降，四足机器人可能会比人形机器人更早形成较完整的商业闭环。但整体来看，机器人产业依旧非常早期，距离真正成为一个能独立应变的“优秀员工”，还有相当长的路。

机器人开始走进工厂，但距离“好员工”还有多远