“机械飞升”与“镜中故我”
2025年4月19日,全球首场人形机器人参与的半程马拉松比赛在北京亦庄举行,和人类的马拉松赛事同步展开。最终,身高约1.8米、体重55千克的全尺寸人形机器人“天工Ultra”以2小时40分42秒的成绩顺利完赛并夺冠。作为一个从事机器人方向研究的学术混子,这条消息无疑让我激动不已,以至于几乎全程观看了比赛的直播。然而,当我满怀兴奋地把这条新闻分享给身边的其他人时,却不止一次从不同的人口中听到了相似的质疑:“为什么要造人形机器人?狗形/轮式机器人不是比这要稳/快多了?”诚然,这样的疑问并非没有道理:如果和我一样看过直播就不难发现,目前人形机器人的动作确实十分不协调,几乎每隔几分钟就会出现摔倒的情况。即便是作为冠军的“天工Ultra”,其表现也只能说是差强人意;而其他参赛机器人更是连完赛都十分困难,有的甚至在出发点处就一摔不起。而仅从成绩上看,2小时40分42秒的完赛时间也远远谈不上优秀,甚至在普通人类参赛者中也几乎处于垫底位置,完全没有体现出机器人在速度上的潜在优势——毕竟,如果换上一辆正常的电动车,可能只需要十几分钟就能跑完全程。
尽管如此,对于“为何要坚持发展人形机器人”这个问题,我个人仍然持理解态度:因为这也许是机器人发展过程中不得不品鉴的一环,或者说一种权宜之计——毕竟,机器人的主要设计目的就是为人类服务,而当前由人类所构建的生存环境中,绝大多数基础设施又都是按照人类的身体结构量身打造的。对于如此庞大的工程存量,我们当然不可能指望在短时间内为了迎合机器人而把它们全都推倒重构。因此在很长一段时间内,即便轮式机器人可能具备更高的潜在效率,它们的应用也只能局限于平坦、规则、结构化的场景——比如工厂、仓库或者矿井当中。而在面对楼梯、门槛、狭窄通道等人类生活中真实存在的复杂地形时,可能也只有具备类似人体结构的人形机器人才能无缝衔接了。至于和狗形机器人的比较,那就不是工程学的问题,或许要从自然界真正的演化逻辑中寻找答案。
事实上,如果我们把目光放到自然界的漫长演化过程当中,就不难发现“人形”这一结构可能并不是什么效率最大化的最优结果,而是数亿年间的基因“屎山翻涌”的妥协产物(参见之前的杂谈)。与四足着地的其他哺乳动物相比,人类的直立行走固然有其优势:比如更广阔的视野、上肢的解放,以及在长距离移动中更优秀的能量效率和散热机制等——这可能也是人类在原始时代能以耐久的方式捕杀远比自己强壮的猎物的原因之一(事实上,人类可能也是唯一能够完成完整马拉松的物种)——但这一结构也绝非完美无缺:直立行走带来的额外脊柱负担让人类更容易罹患腰椎疾病、膝关节磨损等问题;而内脏因重力作用而产生的下垂风险,也是其他哺乳动物较少面临的困扰。换句话说,人类的身体结构从来都不是什么“最优解”,而是在特定环境与时间尺度下的“可行解”。因此,当我们以人类作为仿生学灵感构建机器人时,就必须意识到其中的局限性——尤其是考虑到生物系统所使用的“材料”是柔性组织、肌肉、韧带和骨骼,而机器系统则是刚性金属、电机和传感器,二者在尺度、弹性、耐久性和控制机制上都存在本质差异。换句话说,人类的身体结构是专门为了“血肉之躯”优化的,并不天然适用于由电线和轴承构成的机械系统。退一万步说,人类的形态之所以是现在这个样子,也只是为了适应充满不确定性的自然环境,而非今天这种由钢筋水泥堆砌起来的人造世界——实际上,由于工业发展的速度远超人类自身的演化节奏,目前的人类已经出现了很多反而不适应人造环境的问题,尤其是不少所谓的“文明病”(比如糖尿病就是人类不适应工业化生产的饮食导致的)。因此,回到前文的问题,为什么如今的机器人仍然做成“人形”?我想,或许只是为了更好地适应当前这个完全按照“人类”尺度设计的屎山世界吧。
更有趣的是,当我们以“直立行走”这一相同的任务作为比较起点时,就会惊讶地发现:一直都以运算速度著称(每秒钟能进行几百亿次运算)的机器人,在这项原始却又复杂的能力面前竟然远远地落后于人类——尽管它们搭载了“强大”的算力和复杂的人工神经网络,但在处理动态平衡、步态控制之类的任务时,它们的表现仍然显得笨拙而不稳定——甚至不如一个刚学会走路不久的幼儿。这一点也已经得到了生物学研究的佐证:目前的研究表明,人脑的三维神经网络在结构复杂性、并行处理能力、时延控制等方面,可能都远超当今的二维芯片所能企及的水平。此外,从能量密度的角度看,全身各处都能存储能量的人类也是遥遥领先——在这次机器人马拉松中,“天工Ultra”之所以能够完成比赛,靠的是“电池快换”技术的支撑。尽管这的确是一项工程上的突破,但它仍然掩盖不了目前机器人在续航能力上的巨大劣势:每隔几小时就要更换电池。而人类呢?在仅靠自身能量储备的情况下,便能持续进行数小时的高强度活动,甚至可以在不进食的极端情况下下维持好几天的生命活动与行动能力。这足以说明,至少目前,人类的血肉之躯或许仍然保有相当程度上的“优雅”——以极低的能耗完成复杂而稳定的自律运转。“机械飞升”或许是一条可行的技术路径,但要真正超越这个被自然选择打磨了亿万年的“终极系统”——人类自身,我们恐怕还有很长的一段路要走。
不过正如我在之前的年终总结中曾提到过的那样:当某一事物的发展水平远远低于或高于个体感知的维度时,我们往往很难准确把握它的进步速度;只有当它的能力开始接近、甚至逐步超越人类本身时,我们才会真正意识到它所发生的变化有多么惊人——而此刻的人形机器人,或许正行走在这样的边界线上。我们现在当然可以调侃它们步态笨拙、摔倒频繁,但这正是因为它们与我们“足够相似”,才让它的每一次动作失衡都显得如此刺眼,也让它的每一个微小进步都显得如此震撼。我们几乎无需怀疑,在以人类历史尺度计算几乎只是一瞬的未来,一个拥有大量类人机器人的新社会就将如期而至——那时,它们不仅在外形上逐渐逼近于人类,更可能因为搭载了新一代的多模态LLM系统,而在语言能力、逻辑能力、情感识别乃至行为模式上逐步与人类趋同,甚至在某些方面超越人类的平均水平。到那时,我们甚至可能无法轻易分辨,眼前的某个正与你自然交谈的“人”,究竟是人类,还是一个高仿真机器人。
正因如此,尽管站在今天这个节点上,我们仍可以从能效比、工程性能、应用场景等角度批评人形机器人尚不“实用”,但在更深层的意义上,它们或许代表着人类在自我复制的道路上的一次一次必经尝试。从模仿外形到模仿动作,从模拟语言到模拟思维,我们始终在试图塑造一个“可以替代自身”的智能系统。而“人形”的意义,或许也只是我们在这个过程中为自己设定的一面镜子——一面用来凝视自身、理解自身、超越自身的镜子。那么,当这面镜子终于映照出一个与我们无异的身影时,它对我们的回应,是否也将反过来改变我们对“自我”的理解?我们在凝视它的同时,是否也正在成为它眼中的“镜中故我”?
《镜中故我》,出自游戏《崩坏:星穹铁道》