曾经,波士顿动力(Boston Dynamics)凭借人形机器人的跑酷、后空翻乃至火爆全网的“男团舞”视频,刷新了大众对机器人的想象。


图|波士顿动力机器人合跳韩国男团舞蹈(来源:Youtube)

然而,随着行业从狂热炒作转向冷静落地,这家公司也显露出高开低走的疲态:Atlas 的炫技视频虽屡屡刷屏,却始终停留在技术演示阶段,迟迟未能转化为可规模化的商业产品;其四足机器人 Spot 虽已在部分场景实现部署,但营收贡献有限。

就在去年,波士顿动力迎来一次重大变革。无法量产的液压版 Altas 宣布退役,电动版 Altas 上线。这体现了团队的战略重心转换,他们不再满足于成为网红公司,而是要让产品真正落地,走向商业化。


图|电动版 Atlas(来源:Boston Dynamics)

近日,公司产品负责人 Aya Durbin 接受了媒体的深度专访。作为连接工程研发与客户现场落地的关键人物,Durbin 以务实的视角,在访谈中拆解了 Atlas 商业化背后的门槛挑战:在纸箱歪斜、叉车乱停、噪声震耳的工厂环境中,要让机器人日复一日地稳稳搬起一个 55 磅的纸板,不出错、不宕机、不依赖人工干预。

在对话中,Aya Durbin 并没有过多谈论机器人的运动天赋,而是将焦点锁定在“部署(Deployment)”、“可靠性(Reliability)”和“自主性(Autonomy)”这三个关键词上。对于波士顿动力而言,让机器人学会跳舞已经是过去式,现在的目标是让它在工厂里稳健地搬砖。


(来源:interesting engineering)

从“展示品”到“工业品”

很长一段时间里,液压驱动的 Atlas 是波士顿动力的名片。但在 Durbin 看来,那个版本的 Atlas 有着明确的局限性——它是为了“研究和兴奋(research and excitement)”而生的。

它的使命是向研发团队和全世界展示人形机器人究竟能做到什么动作,是可能性的探索者,而非问题的解决者。

因此,当波士顿动力决定转向全电动版本时,Durbin 指出,它的目标只有一个:解决现实世界的问题。

这种转变首先体现在对应用环境的定义上。液压版是在实验室里精雕细琢的,而电动版设计之初就是为了投放到“棕地设施(Brownfield facilities)”中。所谓的棕地,指的是那些已经存在、设施陈旧、空间布局主要为人设计的工厂。


图 | 典型“brown field”(来源:Talonlpe)

这里的通道狭窄,货架高度不一。新的 Atlas 必须是一个通用的“功能性替代者”,它需要能够直接走进这些环境,达到甚至超过人类工人的功能预期——能够得着高处的货架,提得起重物,也能蹲下处理低处的任务。

更深层的差异在于可制造性和规模化。Durbin 直言,液压版 Atlas 从未考虑过大规模量产,它更像是一台精密的 F1 赛车;而电动版则必须成为“丰田卡罗拉”。在硬件层面,它必须可靠、易于维护,并且能够在生产线上大规模制造。在软件层面,它必须从实验室里的定制化演示,进化为能够应对工业现场各种变量的鲁棒系统。

为什么非要人形机器人?

不过,在波士顿动力的产品矩阵中,已经有了四足机器人 Spot 和仓储机器人 Stretch。为什么还需要一个人形机器人?什么样的工作非人形不可?

Durbin 并没有回避专用机器人的价值。她明确表示,专用机器人和传统自动化设备永远有一席之地,波士顿动力并不认为人形机器人会淘汰它们。但在某些特定任务上,人形结构具有不可替代的经济性优势。

例如汽车行业的排序(Sequencing)环节。

这是一个典型的汽车制造前序工作:供应商将各种零部件运送到物流中心,现场工人需要将这些零件(例如不同颜色、不同配置的门把手)按照汽车总装线上的生产顺序,人工检出并放入特定的料架。这样,当料架被运送到总装线旁时,装配工人伸手就能拿到正好匹配当前车辆的零件。

Durbin 认为这个环节十分适合 Atlas 完成:

首先,它要求零改造落地的能力。排序作业通常发生在传统的“棕地”工作单元中。如果使用传统的自动化设备,工厂可能需要拆除现有的货架,重新设计传送带,甚至改造整个车间,成本极高。而人形机器人可以直接走进现有的工作单元,像人一样利用现有的空间和工具。

其次,汽车行业变化极快。如果车型改款,或者零件尺寸变了,传统自动化产线可能需要停工改造。而对于 Atlas,客户只需要在软件上进行调整,几天内就能适应新任务,无需厂商介入。

同时,人形机器人还能做到资产复用。如果未来某天,这个排序的工作单元被取消了,专用机器人可能就变成了废铁,但 Atlas 可以直接走到隔壁区域,去执行机器看护(Machine Tending)或其他任务。

应对“脏乱差”:AI 如何解决非结构化难题

但是,工业现场并不是演示视频里那种光鲜亮丽、一尘不染的实验室。真实的工厂是脏乱的、不可预测的。

Durbin 说道,“我们很清楚,在不标准的环境中,你不能指望叉车司机把托盘精准地放在毫米级的指定位置。不然你早就用六轴机械臂来干活了。”

为了应对这种非结构化的混乱,波士顿动力在 AI 尤其是强化学习(Reinforcement Learning)上投入了巨大资源。

Durbin 透露,得益于机器人 AI 的最新进展,Atlas 现在具备了极强的环境适应性。

通过仿真训练(Sim-to-Real),Atlas 在虚拟环境中经历了数千种不同的场景布局、数千种意外情况和异常流程的训练。这使得它在现实世界中,当遇到设备位置偏移、光线变化或障碍物干扰时,不需要重新编程,就能依靠本身的模型进行调整和处理。

以前,为了让机器人稳定工作,工程师可能需要花几周时间去调试每一个动作坐标;现在,通过行为克隆(Behavior Cloning)和大规模预训练,机器人拥有了类似于“小学水平”的基础通识——它认识物体,理解物理属性,具备基础的操作逻辑。

Durbin 强调,他们的目标是让机器人足够稳定,将人工干预降到最低。如果机器人一遇到意外就报错停机需要人去扶,那它就不是帮手,而是负担。

而在谈及人机交互界面(UI)时,Durbin 泼了一盆冷水:在工业环境里,语音控制是个伪命题。

尽管当前很多人形机器人演示喜欢展示“听懂自然语言指令”的能力,但 Durbin 从实战角度指出了其局限性:

一个是工业设施内部噪音极大,机器轰鸣声中,语音指令很难被准确拾取和识别。

安全和权限也是一大限制。在工厂管理中,权限就是安全。你绝对不希望看到这样的场景:随便一个路过的人,或者并未获得授权的员工,对着机器人喊一声“停下”或者“换个活干”,机器人就真的执行了。


(来源: Nano Banana Pro)

因此,波士顿动力开发了一个名为 Orbit 的软件平台,作为人机交互的核心载体。目前所有的交互都通过这个软件界面进行。管理者可以在 Orbit 上查看机器人视角,监控工作进度,下达任务,或者在出现异常时进行干预。

护城河:实战经验与可维护性

随着特斯拉 Optimus、Figure 等竞争对手的涌入,人形机器人赛道变得拥挤不堪。波士顿动力的护城河究竟在哪里?

Durbin 给出的答案非常务实:实战经验(Real Miles)。

“即使是现在,我们也有数千台机器人(Spot 和 Stretch)正在客户的设施里实际运行。拥有这些真实的运行里程,拥有经过实战打磨的软件,以及处理过数千个客户提出的真实需求,这是我们巨大的差异化优势。”

通过大规模部署 Spot,波士顿动力学到了两个关于工业级产品的深刻教训,并在 Atlas 上进行改进:

一个是可支持性(Supportability): 在实验室里,机器人坏了可以由博士们围着修;但在客户现场,机器人坏了就是停产事故。Durbin 强调,Atlas 的设计高度重视维修的便捷性。他们采用了“现场可更换单元(Field-Replaceable Units)”的模块化设计,确保一旦发生故障,客户的技术人员可以快速更换模块,而不是必须把整台机器运回原厂。

另一方面是量产工艺: 制造一台机器人和制造一万台机器人是两个物种。得益于现代汽车(Hyundai)的控股关系,波士顿动力在建立大规模生产线方面拥有得天独厚的优势。Durbin 表示,他们正在利用 Spot 的生产经验以及现代汽车的制造专长,构建 Atlas 的量产体系。

“一旦人形机器人市场开始爆发,竞争的关键就不再是谁的机器人能后空翻,而是谁的产品更可靠、更易于维护、更能量产。”

人机关系:接手那些人类不想干的“苦差事”

最后,针对“机器人抢饭碗”这一敏感话题,Durbin 分享了她在数百个客户现场调研时的真实观察。她指出,即使到了 2025 年,许多工业环境中仍存在大量极度繁重、枯燥且不符合人体工学的手工劳动——这些恰恰是 Atlas 应该去填补的空白。

她举了一个典型例子:纸板装载。在不少包装产线上,工人需要反复将一叠压扁的纸板塞入成型机中。这叠纸板通常高约一英尺(30 厘米),重达 55 磅(约 25 公斤)。操作时,工人必须不断弯腰、搬起、对准、推入——日复一日,动作高度重复。

“从人体工学角度看,这是极其糟糕的工作,”Durbin 说,“工厂根本招不到愿意长期干的人。更麻烦的是,纸板是软性、非刚性的材料,容易滑动或翻倒,传统硬自动化设备很难可靠处理。结果只能靠人来干。”

现实情况往往是:新招的工人干两三个月就离职;如果有人表现得特别能吃苦,反而会很快被调去更轻松的岗位——于是这个岗位永远在缺人,永远在流失。

“这些就是我们所说的最糟糕的区域(Worst Areas),”Durbin 强调。波士顿动力的策略正是聚焦于这类场景——利用 Atlas 超越人类的体力耐力,结合 AI 赋予的环境适应能力,接手那些最容易导致职业伤害、疲劳和人员流失的任务。

在她看来,人形机器人最健康的定位并非取代人类,而是填补真实的劳动力缺口,承担高负荷、高重复性的“脏活累活”,从而把人类工人解放出来,去做更需要判断力、灵活性和创造力的工作。

现实的边界:触觉与高精度的挑战

尽管技术进步神速,Durbin 依然保持着工程师的严谨。她坦言,有些任务在短期内依然是人形机器人的禁区。

目前最大的技术瓶颈在于极高精度和极高灵巧性的结合,尤其是那些依赖“触觉反馈”的任务。

“比如在汽车总装中,把一个小零件装进车门里。人类工人能感觉到‘咔哒’一声,那个零件卡到位了;或者在安装橡胶密封条时,你能感觉到橡胶刚刚好抵住边框的阻力,”Durbin 描述道,“这些是深度的人类感知体验。”

虽然现在的机器人可以配备力传感器,视觉系统也非常发达,但在处理这种需要微妙手感、需要判断“什么时候才算装好了”的任务时,机器人依然显得笨拙。要在汽车总装线上全面解决这些涉及复杂触觉反馈的问题,依然需要基础研究层面的重大突破。

https://interestingengineering.com/ai-robotics/boston-dynamics-aya-durbin-humanoids

运营/排版:何晨龙