机器人打破人类半马世界纪录:当机器肌肉开始超越人类极限
机器人打破人类半马世界纪录:当机器肌肉开始超越人类极限
2026年4月19日,北京亦庄。气温14℃,微风,能见度良好。一台由深圳荣耀智慧科技(Shenzhen Honor Smart Technology)研发的人形机器人Flash,以50分26秒完成21.0975公里半程马拉松赛程,打破了人类世界纪录保持者Jacob Kiplimo在2026年3月里斯本半马创下的57分01秒。(来源: Xinhua, 2026-04-19;World Athletics官方纪录页面确认Kiplimo于2026年3月16日里斯本半马刷新世界纪录)
一台机器,在自主导航模式下——没有远程操控、没有人类干预——比地球上跑得最快的人类还快了将近7分钟。
这不是波士顿动力实验室里的demo视频,不是CG渲染的概念片,而是一场有100多支队伍、约300台机器人、26个品牌参与的公开赛事中的真实成绩。更令人震惊的是时间维度上的对比:2025年首届亦庄半马机器人赛的冠军天工Ultra,完赛时间是2小时40分42秒。仅仅一年,冠军成绩从2:40:42缩短到50:26——速度提升超过3倍。(来源: Xinhua, 2026-04-19)
如果机器人以同样的速率持续进步,再过一年冠军成绩将压缩到17分钟以内。当然,这不会发生——任何技术进步都遵循S曲线,早期的陡峭增长终将进入平台期。但关键在于:我们目前仍处于这条S曲线最陡峭的上升段,而人类的57分01秒已经被甩在了身后。
这篇文章不是关于一场比赛。它关于一个信号:人形机器人的能力评价体系正在从”能不能动”跃迁到”动得多好”,而这个跃迁背后,是硬件迭代周期、AI控制算法、以及中国机器人产业生态的一次集体亮相。更深层地,它揭示了一个大多数人尚未意识到的趋势:公开竞技赛事正在取代demo视频和实验室基准测试,成为人形机器人行业新的能力定价机制——而掌握这个定价机制的人,将掌握下一轮产业竞争的话语权。
一、数字冲击力:一年3倍意味着什么
让我们先把数字拆开看。
2025年4月,首届北京亦庄半程马拉松机器人赛。参赛规模:约20支队伍。完赛队伍:6支。冠军天工Ultra的成绩:2小时40分42秒,折合平均配速约7分37秒/公里,平均时速约7.8公里/小时。这个速度大致相当于一个普通成年人的慢跑速度。(来源: Xinhua, 2026-04-19)
2026年4月,第2届。参赛规模:100多支队伍,约300台机器人,26个品牌,包括来自德国、法国、巴西的国际团队。冠军Flash的成绩:50分26秒,折合平均配速约2分23秒/公里,平均时速约25公里/小时。这个速度已经超过了人类半马世界纪录保持者Jacob Kiplimo的57分01秒(平均时速约22.1公里/小时)。(来源: Xinhua, 2026-04-19)
从7.8公里/小时到25公里/小时。一年。3.2倍。
这个提升幅度需要放在正确的参照系中才能理解其含义。人类半马世界纪录的演进历史是以秒为单位、以十年为周期计量的。从2010年代到2020年代,人类半马纪录从大约58分多缓慢逼近57分区间。Kiplimo在2024年西班牙瓦伦西亚半马跑出57分31秒,随后在2026年3月里斯本进一步推至57分01秒——每一次突破都是人类生理极限的微小延伸。(来源: World Athletics官方纪录)
而机器人在12个月内实现了3倍以上的速度跳跃。
这种指数级提升的来源是什么?
需要明确的是,这种3倍提升不能简单归因于某一个技术突破。它是多个维度同时改善的结果——而这恰恰是人形机器人与传统工业机器人的关键区别所在。
第一,硬件层面的迭代。 人形机器人的运动能力受限于关节电机的功率密度、结构刚度、散热效率以及整体重量。2025年的天工Ultra完赛时间2:40:42暗示其面临严重的续航和散热瓶颈——2个多小时的持续运动对电池和电机都是巨大考验。Flash将时间压缩到50分钟,意味着它要么在更短时间内输出更高功率(电机和传动系统的飞跃),要么在能量效率上实现了数量级改善,或者两者兼有。作为参照,宇树科技(Unitree)在2024年底发布的H1人形机器人已经展示了3.3m/s(约12km/h)的双足奔跑能力,其采用的准直驱电机方案在功率密度上较传统谐波减速器方案有显著提升。(来源: Unitree Robotics官方发布, 2024)Flash的25km/h意味着在此基础上又实现了一倍以上的速度突破。
第二,运动控制算法的进化。 双足行走本身就是一个极其复杂的动态平衡问题。从”能走完”到”快速跑完”,控制算法需要处理的状态空间呈指数级扩大——更高速度意味着更短的地面接触时间、更大的冲击力、更复杂的重心迁移轨迹。2024至2026年间,基于大规模并行仿真训练的运动策略优化取得了显著进展。NVIDIA Isaac Gym等GPU加速仿真平台使得研究者能够在数小时内完成相当于数千年真实时间的训练迭代,极大加速了sim-to-real(仿真到现实迁移)的效率。(来源: Makoviychuk et al., “Isaac Gym: High Performance GPU-Based Physics Simulation For Robot Learning,” arXiv:2108.10470)这类技术很可能是Flash能够以25km/h速度稳定奔跑的关键因素之一——但需要强调,这是基于公开技术趋势的合理推断,Flash团队尚未公开其具体算法架构。
第三,参赛规模本身就是加速器。 2025年20支队伍,6支完赛。2026年100多支队伍,26个品牌。(来源: Xinhua, 2026-04-19)参赛者数量扩大5倍,意味着竞争压力和技术交流密度同步放大。更多团队意味着更多技术路线被并行测试,最优解被更快地发现和传播。这是一个典型的正反馈循环:赛事吸引团队→竞争推动技术→成绩提升吸引更多关注→更多团队参赛。
对立视角一:3倍提升是否有”水分”?
一个合理的质疑是:2025年的天工Ultra成绩(2:40:42)是否代表了当时的技术上限?如果首届赛事更多是”展示性”而非”竞技性”的——参赛团队可能更关注完赛而非速度——那么2025到2026年的3倍提升中,有多少是真正的技术进步,有多少是”参赛态度”的变化?
这个质疑有相当的分量。2025年仅20支队伍参赛、6支完赛的数据确实暗示那一届赛事更接近于一次技术验证而非激烈竞争。此外,2025年的参赛机器人中,部分可能采用了保守的运动策略——以低速确保完赛,而非冒着摔倒风险追求速度。
但即便打一个大折扣——假设2025年的”认真参赛”成绩应该在1:30:00左右——从1:30:00到50:26仍然是接近2倍的提升,这在任何工程领域都是惊人的年度改善率。更关键的是,超越人类世界纪录这一事实本身无法用”参赛态度变化”来解释。 无论2025年的基线如何调整,50:26都是一个绝对意义上的工程突破——它意味着一台双足机器人能够以25km/h的速度持续奔跑50分钟,这在2024年之前是任何人形机器人都未曾公开展示过的能力。
对立视角二:S曲线的警告——3倍增速能持续吗?
另一个更深层的质疑来自技术发展的一般规律。几乎所有技术进步都遵循S曲线:早期缓慢起步,中期陡峭增长,后期逐渐趋于平台。机器人从”勉强能跑完”(7.8km/h)到”跑得很快”(25km/h)的3倍跳跃,很可能发生在S曲线最陡峭的中段。将这个增速线性外推是危险的。
物理定律设定了硬性上限:双足奔跑的速度受限于腿部长度、地面接触力学、空气阻力和结构强度。人类短跑的理论极限被生物力学家估计在约40km/h左右(Usain Bolt的峰值速度约44.72km/h,但仅能维持数秒)。机器人虽然不受生物限制,但材料强度、电机功率密度和电池能量密度同样设定了物理天花板。
我的判断: 3倍的年度增速几乎不可能持续。但即便增速放缓到年度30-50%——这在硬件工程领域仍然是极快的——人形机器人在未来2-3年内在大多数体力任务上超越人类平均水平也是高度可能的。Flash的50:26不应被解读为”指数增长的起点”,而应被解读为人形机器人运动能力跨越实用门槛的标志。
二、从比赛规则看技术路线之争:远控 vs. 自主导航
2026年亦庄半马引入了一个关键的赛制创新:将参赛模式分为远程操控(teleoperation)和自主导航(autonomous navigation)两种类别。(来源: Xinhua, 2026-04-19)
这不是一个简单的分类设计。这是一个关于人形机器人技术路线的根本性选择,被编码进了比赛规则中。
为什么自主导航更受鼓励?
根据报道,自主导航模式下的完赛时间不乘以任何系数,而远控模式的时间需要乘以一个惩罚系数(这意味着远控模式在排名上处于劣势)。中国电子学会(Chinese Institute of Electronics)解释了这一设计的逻辑:设置系数是为了引导参赛团队向自主导航方向研发,因为自主导航是未来人形机器人在日常生活中实际应用的技术基础。(来源: Xinhua, 2026-04-19)
约40%的参赛队伍选择了自主导航模式。(来源: Xinhua, 2026-04-19)这个比例本身就是一个重要信号——它说明自主导航已经不是少数先锋团队的实验,而是接近一半参赛者认为可行的技术路线。
Flash正是在自主导航模式下取得了50:26的成绩。(来源: Xinhua, 2026-04-19)这意味着这台机器人不仅要以25km/h的速度奔跑,还要同时处理实时环境感知、路径规划、障碍物避让、赛道边界识别等一系列认知任务——而且是在一个有数百台其他机器人同时运动的复杂动态环境中。
远控 vs. 自主导航:两种完全不同的商业化路径
远控路线 本质上是”人类智能 + 机器人身体”的组合。操控者通过VR手套、动作捕捉设备或遥控界面来控制机器人的运动。这条路线的商业逻辑是:机器人作为”远程身体”,让人类能够在危险环境中工作。Tesla Optimus早期展示中使用远控操作来收集训练数据(Elon Musk在2023年Tesla AI Day上确认了这一策略),Figure的早期部署也依赖人类操作员的监督。(来源: Tesla AI Day 2023直播;Figure官方博客)
自主导航路线 则是”AI智能 + 机器人身体”的组合。机器人依靠自身的感知系统和决策算法独立完成任务。这才是真正能够实现规模化部署、替代人类劳动力的路径。
赛事规则通过系数设计明确倾向自主导航,这不仅仅是一个技术偏好,更是一个产业政策信号。 一个需要人类远程操控的机器人,其经济性受限于操控者的数量和注意力带宽;而一个自主运行的机器人,其经济性仅受限于硬件成本和能源消耗。中国工信部在2023年发布的《人形机器人创新发展指导意见》中明确提出,到2027年人形机器人要在”非结构化场景”中实现”自主作业”——亦庄半马的赛制设计与这一政策方向高度一致。(来源: 中国工信部, 2023-11-02)
对立视角三:”自主导航”的定义边界在哪里?
这里存在一个被大多数报道忽略的关键问题:“自主导航”的具体定义是什么?
如果机器人在赛前已经获得了高精度赛道地图(包括弯道位置、坡度变化、路面材质等),并将这些信息预加载到导航系统中,那么它在比赛中的”自主导航”实际上更接近于”沿预设路线的自主执行”——这与在完全未知环境中的自主导航有本质区别。
类比自动驾驶领域:在高精地图覆盖的高速公路上实现L4级自动驾驶,与在没有地图的乡间小路上实现同等级别的自动驾驶,技术难度相差数个量级。
目前公开报道未详细说明亦庄半马对”自主导航”的具体技术定义——是否允许预加载地图?是否允许赛前勘察赛道?GPS辅助定位是否被允许?这些细节对于评估Flash成绩的技术含金量至关重要。
我的判断: 即便考虑到可能的预加载地图等”辅助条件”,Flash在自主导航模式下以50:26完成半马仍然是一个重大成就。原因在于:即使有预设路线,在25km/h的速度下实时处理动态障碍物(其他机器人)、维持动态平衡、管理能量输出,这些挑战是地图无法预先解决的。但行业需要尽快建立更精确的”自主导航”分级标准,否则这个概念将被过度营销所稀释。
自主导航半马的技术含金量
让我们具体分析Flash在自主导航模式下完成半马需要整合哪些技术能力:
实时感知与建图(Perception & Mapping): 以25km/h的速度奔跑时,机器人每秒移动约7米。在这个速度下,感知系统需要在毫秒级别完成环境理解——识别赛道边界、其他机器人、路面不平整、弯道曲率等。这对激光雷达(LiDAR)、视觉相机和IMU(惯性测量单元)的融合处理提出了极高要求。
动态路径规划(Dynamic Path Planning): 半马赛道不是空旷的直道。有弯道、有其他参赛机器人、可能有路面变化。在25km/h的速度下,路径规划算法需要在数十毫秒内完成决策——是加速超越前方机器人,还是减速等待,抑或变换路线绕行。
运动控制与感知的实时耦合: 这可能是最被低估的技术挑战。在远控模式下,运动控制和环境感知是解耦的——人类操控者负责感知和决策,机器人只负责执行运动指令。但在自主导航模式下,感知、决策和运动控制必须在同一个计算平台上实时耦合运行。以25km/h奔跑时,任何一个环节超过10毫秒的延迟都可能导致摔倒或偏离赛道。
能量管理: 50分钟的高速奔跑对电池系统是极大考验。机器人需要在整个赛程中维持稳定的功率输出,同时为感知和计算系统预留足够的电力。当前锂电池的能量密度约为250-300Wh/kg(来源: BloombergNEF, 2025),这意味着一台50kg的机器人如果携带5kg电池,总能量约为1.25-1.5kWh——要在50分钟内支撑高速奔跑和全部计算负载,能量管理策略必须极其精细。
我的判断: Flash在自主导航模式下以50:26完成半马,这个成绩的技术含金量远高于单纯的速度数字所暗示的。它证明了一个完整的”感知-决策-执行”闭环系统可以在高速、动态、真实世界环境中稳定运行超过50分钟。这是人形机器人从实验室走向真实世界部署的一个关键里程碑。
三、竞赛场作为新的AI能力测试台
人形机器人行业长期面临一个根本性问题:如何评价一台人形机器人的能力?
在工业机器人领域,评价标准是清晰的——重复定位精度(±0.01mm)、负载能力(kg)、循环时间(秒/次)。但人形机器人被设计用于非结构化环境中的通用任务,这些任务的复杂度和变异性使得传统评价体系完全失效。
过去几年,行业主要依赖两种评价方式:
第一种是demo视频。 公司发布精心剪辑的演示视频,展示机器人完成各种任务。问题显而易见——视频可以选择性展示最好的结果,隐藏失败案例。Tesla Optimus在2022年AI Day上的首次亮相就因疑似使用远控操作而受到广泛质疑。(来源: IEEE Spectrum报道, 2022-10)
第二种是实验室基准测试(benchmark)。 学术界开发了DARPA Robotics Challenge(2015年决赛)、RoboCup等标准化测试。但这些测试往往过于学术化,更新频率低,与快速迭代的商业需求脱节。
亦庄半马提供了第三种评价范式:公开竞技赛事。
为什么半马是一个优秀的能力评估框架?
标准化且不可作弊。 21.0975公里的赛道长度是固定的,计时系统是公开的,所有参赛者在相同条件下竞争。你不能通过剪辑视频来伪造成绩。(当然,赛道距离是否经过独立第三方测量认证,是一个值得追问的问题——目前公开报道未提及这一细节。)
综合性。 完成半马需要整合运动控制、能量管理、散热、结构耐久性、感知和决策等多个维度的能力。任何一个维度的短板都会直接反映在最终成绩上。
可量化且可比较。 50:26 vs. 2:40:42。数字不会说谎。不同团队、不同年份的成绩可以直接比较,形成清晰的进步曲线。
与人类基准直接对标。 人类半马世界纪录57:01提供了一个每个人都能直觉理解的参照系。”比人类最快的跑者还快7分钟”——这个表述的传播力远超任何技术指标。
从”能干活”到”干多好”:评价维度的质变
这是本文的核心洞察之一。
在过去3年的人形机器人叙事中,核心问题一直是”能不能”——能不能走路?能不能搬箱子?能不能上楼梯?行业的注意力集中在功能验证(functional validation)上。
Flash的50:26标志着一个转折点:评价维度从”能不能”(binary)转向”多好”(continuous)。
这个转变的意义是深远的。在”能不能”阶段,先发优势巨大——第一个能走路的机器人会获得不成比例的关注和资源。但在”多好”阶段,竞争变成了持续优化的马拉松——每一个百分点的改善都需要更多的工程投入,而落后者有明确的追赶目标。
这种转变在其他技术领域有先例。自动驾驶行业从”能不能自动驾驶”(2015-2018年的demo阶段)转向”自动驾驶有多安全”(Waymo公布的每百万英里脱离次数从2019年的0.076次降至2023年的接近0),这个转变直接改变了行业的竞争格局和投资逻辑。(来源: Waymo Safety Report, 2023)人形机器人正在经历类似的转折。
对立视角四:半马成绩能代表商业能力吗?
一个严肃的反驳是:跑得快不等于干活好。 一台能以25km/h奔跑的机器人,不一定能精细地组装电子元件或温柔地照顾老人。半马测试的是”全身协调运动能力”,但商业场景需要的可能是”精细操作能力”(灵巧手的抓取精度)或”人机交互能力”(理解自然语言指令、预测人类意图)——这些是完全不同的技术维度。
这个反驳值得认真对待。事实上,当前人形机器人商业化的最大瓶颈可能根本不在运动能力,而在操作精度和任务理解。Figure在2024年展示的与OpenAI大语言模型集成的机器人,能够通过自然语言对话理解任务指令并执行简单的桌面操作——这种认知能力在很多商业场景中可能比跑步速度更有价值。(来源: Figure官方演示视频, 2024-03)
但这个反驳忽略了一个关键点:半马测试的底层能力——动态平衡、能量管理、实时感知、长时间稳定运行——是几乎所有商业场景的基础能力。 一台不能稳定运行50分钟的机器人,也不可能在工厂里完成8小时的工作班次。一台不能在动态环境中自主导航的机器人,也无法在仓库或家庭环境中独立工作。
我的判断: 半马不是人形机器人能力的全部评价,但它是一个极其有效的”底层能力筛选器”。能以50:26完成自主导航半马的机器人,其底层运动和感知能力已经达到了商业部署的门槛。接下来的差异化竞争将发生在上层应用——操作精度、人机交互、任务理解等维度。半马成绩与商业价值的关系,类似于汽车的0-100km/h加速成绩与日常驾驶体验的关系:前者不能完全代表后者,但前者的底层工程能力是后者的必要条件。
四、产业生态的成型:从实验室到赛场的中国机器人赛道
2025年首届亦庄半马:约20支队伍,6支完赛。 2026年第2届:100多支队伍,约300台机器人,26个品牌,包括来自德国、法国、巴西的国际团队。(来源: Xinhua, 2026-04-19)
一年之内,参赛队伍数量增长5倍,参赛机器人数量从数十台增长到约300台。这些数字描绘的不是一场比赛的增长,而是一个产业生态的快速成型。
中国人形机器人赛道的结构性优势
供应链密度。 人形机器人的核心硬件——伺服电机、减速器、力矩传感器、IMU、LiDAR、计算平台——的全球供应链高度集中在中国。深圳及珠三角地区能够提供从原型到量产的完整支持。根据高盛2024年的研报,中国在人形机器人核心零部件领域的全球市场份额超过60%,特别是在谐波减速器(绿的谐波全球市占率约25%)和伺服电机领域具有显著的成本优势。(来源: Goldman Sachs, “Humanoid Robots: The Next Mega Theme,” 2024-01)Flash的制造商深圳荣耀智慧科技正是这个供应链生态的受益者。
竞争密度驱动的迭代速度。 26个品牌、100多支队伍参赛——这意味着中国市场上有大量团队在并行探索不同的技术路线。这种”红海竞争”模式在中国的无人机(大疆从2012年的小型创业公司成长为全球消费级无人机市场70%+份额的主导者)、电动车(2024年中国新能源汽车品牌超过100个)行业中已经被证明是一种有效的产业加速机制。
政策支持与赛事基础设施。 亦庄半马由中国电子学会参与指导,赛事规则的设计直接体现了产业政策导向。(来源: Xinhua, 2026-04-19)中国工信部2023年发布的《人形机器人创新发展指导意见》明确提出2025年初步建立创新体系、2027年形成安全可靠的产业链供应链体系的目标。(来源: 中国工信部, 2023-11-02)亦庄半马可以被视为这一政策框架下的具体落地举措。
国际竞争格局:中美路线分歧
亦庄半马的参赛名单中包含了来自德国、法国、巴西的国际团队,但值得注意的是,目前公开报道中没有提及美国头部人形机器人公司的参与。(来源: Xinhua, 2026-04-19)
这引出了一个重要的观察:中美两国在人形机器人领域正在形成路线分歧。
中国路线偏重”身体”——运动能力和硬件性能。 以亦庄半马为代表,中国产业生态通过公开竞技赛事来推动运动控制、硬件迭代和系统集成能力的快速提升。26个品牌的激烈竞争确保了技术路线的多样性和迭代速度。
美国路线偏重”大脑”——认知能力和AI集成。 Tesla Optimus的策略是在自有工厂中进行封闭测试和部署,重点在于通过大规模数据收集训练端到端的AI控制系统。Figure在2024年与OpenAI合作,将GPT-4级别的语言理解能力集成到机器人系统中,使机器人能够通过自然语言对话理解和执行复杂任务。(来源: Figure官方博客, 2024-03)1X(前Halodi Robotics)则已经在安保场景中进行了早期商业部署。截至本文发布时,这三家公司均未公开参与过类似亦庄半马的运动能力竞赛。
这两条路线最终必须收敛——一个真正有用的人形机器人既需要强大的运动能力,也需要高级的认知能力。但在当前阶段,两条路线的侧重点差异揭示了一个深层问题:“身体”和”大脑”哪个先成为商业化的瓶颈?
我的判断: 中国团队在运动能力维度上的快速突破正在建立一种”硬件能力护城河”。运动控制和硬件优化的know-how是高度经验性的——它不能仅通过阅读论文获得,需要大量的实际测试和迭代。亦庄半马这样的公开赛事加速了这种经验积累。但如果认知能力(理解指令、规划任务、处理异常情况)被证明是商业化的更大瓶颈,那么美国公司在大模型方面的积累可能成为决定性优势。我倾向于认为,在未来3-5年内,”身体”能力将率先达到商业化门槛(Flash的成绩已经证明了这一点),而”大脑”能力将成为差异化竞争的主战场。这意味着中国团队需要尽快补齐认知AI的短板,而美国团队需要加速硬件落地。
五、体能AI商业化路径:从赛道到工厂
Flash的50:26不仅是一个技术里程碑,它还揭示了一条可能的商业化路径——我称之为”体能AI”(Athletic AI)。
什么是体能AI?
传统上,AI商业化主要沿着”认知AI”路径展开——语言模型、图像识别、推荐系统等。这些AI系统处理的是信息,输出的也是信息。
体能AI是一个不同的范畴:它处理的是物理世界的动态交互,输出的是物理动作。 Flash在半马中展示的能力组合——高速双足运动、实时环境感知、长时间稳定运行、自主决策——本质上是一套通用的体能AI能力栈。这套能力栈可以被迁移到多种商业场景中:
物流与仓储: 一台能以25km/h奔跑的机器人,即使在工作场景中只使用10%的速度能力(2.5km/h的快步走),其运动稳定性和续航能力也远超当前的轮式仓储机器人(如Amazon Kiva系统)。更重要的是,双足机器人能够适应楼梯、斜坡、狭窄通道等轮式机器人无法通过的环境。
建筑与施工: 建筑工地是典型的非结构化环境。半马赛道虽然比建筑工地简单,但自主导航模式下的实时感知和路径规划能力是直接可迁移的。
应急救援: 在灾后环境中快速移动、长时间运行、自主导航的能力,与半马中测试的能力高度重合。
商业化的关键瓶颈
从赛道到商业部署之间还有巨大的鸿沟:
成本。 截至本文发布时,暂无公开数据显示Flash的具体制造成本。但作为参照,Unitree H1的售价约为9万美元(来源: Unitree官方定价, 2024),Tesla声称Optimus的长期目标成本为2万美元以下(来源: Elon Musk, Tesla Earnings Call, 2024-Q2)。一台能以25km/h自主奔跑的人形机器人,其硬件成本在当前阶段可能在5-15万美元区间。大规模商业化需要成本降低至少50-70%。
可靠性。 半马是50分钟的测试。商业场景需要的是每天8-16小时、持续数年的稳定运行。从50分钟到数万小时的可靠性跨越,是一个巨大的工程挑战。工业机器人的平均无故障时间(MTBF)通常在8万小时以上——人形机器人距离这个标准还有很长的路要走。
操作精度。 半马测试的是全身运动能力,但大多数商业场景还需要精细的手部操作能力。这是一个相对独立的技术维度,半马成绩无法直接反映。
监管与安全。 一台能以25km/h移动的自主机器人,在公共空间或工作场所中的安全性如何保证?目前全球范围内尚无针对高速自主人形机器人的成熟监管框架。
六、第三层洞察:公开竞技赛事正在成为人形机器人行业的新定价机制
大多数报道将Flash的成绩解读为”技术突破”或”中国机器人实力的展示”。这些解读都没有错,但它们停留在表面。
让我退后一步,提出一个大多数人没有看到的判断:亦庄半马的真正意义不在于Flash跑了多快,而在于它正在建立人形机器人行业的第一个公开、可量化、不可伪造的能力定价机制。
为什么”能力定价机制”如此重要?
在过去3年的人形机器人投资热潮中,估值定价几乎完全依赖于叙事(narrative)而非实证(evidence)。一段精心剪辑的demo视频、一个知名创始人的愿景演讲、一轮来自顶级VC的融资——这些叙事要素驱动了数十亿美元的资本配置。Figure在2024年以26亿美元估值完成了6.75亿美元B轮融资,投资方包括Microsoft、OpenAI、NVIDIA、Jeff Bezos等。(来源: TechCrunch, 2024-02-29)但这个估值主要基于团队背景和技术愿景,而非可量化的产品性能指标。
亦庄半马改变了这个游戏规则。当26个品牌的机器人在同一赛道上竞争,当成绩以分秒精确计量,当自主导航和远控模式被明确区分——一个客观的、可比较的能力排序体系就此建立。
这对行业的影响是深远的:
对投资者: 赛事成绩提供了一个独立于公司叙事的能力验证渠道。”这家公司的机器人在亦庄半马中排名第几”将成为尽职调查中的一个硬指标。这会挤压纯叙事驱动的估值泡沫,将资本引导向真正有技术实力的团队。
对客户: 制造业企业在采购人形机器人时,终于有了一个可以横向比较不同供应商的标准化指标。这类似于汽车行业的Euro NCAP碰撞测试评级——消费者不需要理解碰撞力学,只需要看星级评分。
对政策制定者: 赛事数据为产业政策提供了实证基础。”中国人形机器人在运动能力维度上已经超越人类世界纪录”——这个事实比任何政策报告都更有说服力。
谁掌握定价机制,谁就掌握话语权
这是最深层的洞察。在任何技术产业中,定义评价标准的人往往比赢得评价的人拥有更大的结构性权力。
Intel通过定义x86架构标准主导了PC时代。Google通过定义搜索排名算法主导了互联网信息分发。NVIDIA通过定义CUDA生态主导了AI计算。
如果亦庄半马(以及未来可能出现的更多机器人竞技赛事)成为人形机器人行业公认的能力评价标准,那么制定赛事规则的机构——中国电子学会及其背后的中国产业政策体系——将在全球人形机器人产业中获得一种独特的话语权。 赛事规则中的每一个设计选择(自主导航系数、赛道长度、参赛资格要求)都在隐性地定义”什么是好的人形机器人”——而这个定义将影响全球研发方向和资本流向。
这不是阴谋论。这是标准竞争的基本逻辑。美国在半导体、互联网、AI芯片领域通过标准制定获得了巨大的产业话语权。中国在5G标准(华为在3GPP中的专利贡献)和电动车标准(GB/T充电标准)领域已经展示了类似的策略。人形机器人竞技赛事可能成为下一个标准竞争的战场。
对立视角五:赛事标准会被国际社会接受吗?
一个合理的质疑是:一个由中国机构主导的赛事标准,是否能获得国际社会的广泛认可?如果美国和欧洲的头部公司不参与亦庄半马,这个赛事的”全球定价机制”功能就会大打折扣。
这个质疑有道理。2026年赛事虽然吸引了德国、法国、巴西的团队,但美国头部公司的缺席是一个明显的短板。如果亦庄半马演变为一个”中国内部竞赛”,其作为全球能力定价机制的价值将受到限制。
但历史表明,技术标准的竞争往往不是由”谁参与”决定的,而是由”谁的标准更有用”决定的。 如果亦庄半马的赛事数据被证明能够有效预测机器人的商业部署能力,那么即使美国公司不参赛,客户和投资者也会将赛事成绩作为参考基准。这类似于中国电动车市场的CLTC续航标准——虽然与欧洲WLTP和美国EPA标准不同,但其在中国市场的影响力使得全球车企不得不重视。
我的判断: 亦庄半马目前还处于”能力定价机制”的早期阶段。它的长期影响力取决于两个因素:(1) 赛事成绩与商业部署能力之间的相关性是否被实证验证;(2) 赛事是否能吸引更广泛的国际参与。如果这两个条件在未来2-3年内得到满足,亦庄半马有可能成为人形机器人行业的”ImageNet时刻”——正如ImageNet竞赛在2012年通过AlexNet的突破性成绩重新定义了计算机视觉的评价标准和研发方向。
七、So What:这对你意味着什么
如果你是投资者: 亦庄半马的参赛规模增长(1年5倍)和成绩改善速度(1年3倍)是人形机器人赛道进入加速期的明确信号。但要注意区分”运动能力”和”商业能力”——能跑得快的机器人不一定能最先实现商业化。关注那些能够将运动能力与实际应用场景结合的公司,而非仅仅追求竞速成绩的团队。同时,26个品牌参赛意味着赛道已经相当拥挤,洗牌不可避免。更重要的是,关注赛事成绩背后的”能力定价”逻辑——那些在公开赛事中持续取得优异成绩的公司,将在客户信任和融资谈判中获得结构性优势。
如果你是技术从业者: 自主导航模式下的半马完赛,证明了sim-to-real强化学习、实时感知融合、动态路径规划等技术在真实世界中的可行性。这些技术能力的需求将在未来3-5年内爆发式增长。如果你正在考虑职业方向,运动控制、具身智能(Embodied AI)、机器人感知是值得重点关注的领域。特别是”感知-决策-执行”实时耦合系统的工程经验——这是Flash成绩背后最稀缺的人才能力。
如果你是制造业决策者: 人形机器人进入你的工厂可能比你想象的更快。2025年的机器人还只能以慢跑速度走完半马,2026年就已经超越了人类极限。这种改善速率意味着,即便当前的人形机器人在你的具体场景中还不够成熟,2-3年后的情况可能完全不同。现在开始评估和规划人形机器人的集成方案,不算太早。建议关注亦庄半马等公开赛事的成绩数据,将其作为供应商能力评估的参考指标之一。
如果你是政策制定者: 亦庄半马的赛制设计(自主导航系数、国际参与、标准化规则)是一个值得研究的产业政策创新案例。通过竞赛来引导技术方向、建立评价标准、吸引国际参与——这种”赛事驱动型产业政策”可能比传统的补贴和税收优惠更有效,也更透明。但要警惕赛事标准被过度政治化的风险——如果赛事规则被设计为有利于特定技术路线或特定国家的参赛者,其作为公正评价机制的公信力将受到损害。
如果你是普通读者: 2026年4月19日,一台机器人跑赢了人类。这一天值得记住。不是因为恐惧,而是因为它标志着一个新时代的开始——机器人不再是笨拙的、缓慢的、需要人类帮助才能移动的机器。它们正在变得比我们更快、更持久、更稳定。这个事实将在未来10年内深刻改变我们的工作方式、生活方式和对自身能力的认知。
50分26秒。记住这个数字。它不仅仅是一个比赛成绩。它是人形机器人从”能动”到”动得比人好”的分水岭,是中国机器人产业生态从萌芽到成型的标志,是公开竞技赛事作为技术能力定价机制的起点。
在这个交叉点之后,曲线只会继续分化——尽管增速会放缓,但方向不会逆转。机器人会越来越快、越来越稳、越来越聪明。而人类的57分01秒——Jacob Kiplimo用毕生训练换来的极限——将永远停留在那里,成为一个物种的骄傲,也成为一个时代的注脚。
参考资料
-
Humanoid robot surpasses human half-marathon world record in Beijing — Xinhua News Agency, 2026-04-19
-
Isaac Gym: High Performance GPU-Based Physics Simulation For Robot Learning — Makoviychuk et al., arXiv, 2021-08-23
-
Figure raises $675M Series B at $2.6B valuation — TechCrunch, 2024-02-29
-
《人形机器人创新发展指导意见》 — 中国工业和信息化部, 2023-11-02
-
Humanoid Robots: The Next Mega Theme — Goldman Sachs Research, 2024-01
-
World Athletics半马世界纪录官方数据 — 来源: World Athletics, 2026-03
-
Waymo Safety Report: Autonomous driving performance metrics — 来源: Waymo, 2023