📢 转载信息
原文链接:https://www.qbitai.com/2025/10/339125.html
原文作者:量子位
机器人被狂踹30秒依然屹立不倒?银河通用的“稳如老狗”技术引爆全网!
连续飞踢一台机器人30秒会发生什么?

不到半分钟,这台宇树G1机器人就结结实实挨了十几个飞踢,堪称机生的“至暗时刻”。
尽管网友们纷纷为它打抱不平,但视频展示出的惊人稳定性更让人印象深刻:稳,纯稳、无可争议的稳!

是什么让这台机器人能做到“狂踹不倒”?
答案是银河通用发布的全新通用动作追踪框架——Any2Track。
Any2Track不仅能让机器人精准模仿各种人类复杂动作,更重要的是,它还能实时适应各种真实世界的干扰。
在干扰下依然能平滑追踪人类动作,这在机器人技术领域是一大突破。

将动作捕捉与现实世界的适应性无缝结合,是具身智能发展的关键一步。

更值得一提的是,Any2Track不局限于人形机器人动作追踪,它还是一个强大的基础动作追踪模型,支持多种下游任务,如:
- 全身遥操作
- 人形机器人技能学习
- 人形机器人VLA模型
- ……
接下来,让我们深入了解Any2Track是如何实现这一成就的。
硬核技术解析:兼顾精准模仿与强大抗干扰能力
动作追踪旨在让机器人准确捕捉并复现人类的复杂运动。难点在于,如何让机器人在模仿人类动作的同时,还能在真实环境中保持稳定。

一方面,需要机器人学习多样化、高动态、接触丰富的动作知识,具备通用性;另一方面,需要机器人具备在线动态适应能力,克服仿真到现实(sim2real)的差距,灵活应对各种干扰。
然而,在传统方法中,通用性和高度适应性往往难以共存。
为实现这种“鱼与熊掌兼得”,银河通用团队提出了二阶段强化学习框架——Any2Track (Track Any motions under Any disturbances),成功平衡了精准的动作模仿和抗干扰能力。
此举超越了ASAP、GMT等传统方法,实现了零样本(Zero-Shot)的sim2real转移,让机器人在执行复杂动作时依然稳如泰山。

论文链接:https://arxiv.org/pdf/2509.13833
开源链接:https://github.com/GalaxyGeneralRobotics/OpenTrack
Any2Track将动作捕捉的学习过程解耦为AnyTracker和AnyAdapter两个阶段:

阶段一:AnyTracker——通用动作追踪模块
AnyTracker通过强化学习策略,让机器人的本体感知状态(如角速度、重力、关节状态等)尽可能接近追踪目标动作。
(注:此阶段训练采用AMASS和LAFAN1数据集的组合,不引入动态随机化,以保证基础追踪性能。)
研究团队发现,训练通用动作追踪器的主要挑战在于:人形机器人自由度高、动作空间复杂;以及不同动作类别的分布差异大。
为此,团队设计了标准化动作空间(Canonicalized Action Spaces),通过标准化和残差预测简化动作范围,降低学习难度。

此外,他们还采用了动作聚类(Motion Clustering)和专家到通用(Specialist-to-Generalist)的方法,先训练专家策略处理特定动作,再蒸馏到通用策略,兼顾了训练效率和多样性。
阶段二:AnyAdapter——在线抗干扰适应模块
在AnyTracker训练完成后,AnyAdapter登场。这是一个基于历史信息感知的适应模块,它能够学习环境动力学特征,并动态调整机器人行为,实现在线动力学适应。

团队提出了动力学感知的世界模型预测(dynamics-aware world model prediction)。历史编码器提取动力学特征嵌入,世界模型自回归预测下一帧状态。

训练损失函数如下:

在动力学适应性设计上,Any2Track将适应性定义为基础动作执行能力之上的附加能力。通过冻结AnyTracker参数,引入adapter架构进行微调,adapter通过层级特征融合将适应性注入基础模型,避免了运动追踪性能的下降。
实验验证:Any2Track的卓越表现
为验证Any2Track的性能,研究团队在MuJoCo模拟器和真实世界中,对29自由度的宇树G1进行了测试。
首先,AnyTracker在运动追踪精度上明显优于基线方法,证实了标准化动作空间和专家到通用方法的有效性。

随后,AnyAdapter在面对地形变化、外力作用、躯干质量变化、质心位置偏移、关节摩擦差异等多种干扰时,均展现出超越所有基线方法的在线动力学适应能力。

在真实世界的复杂地形、外部约束和负重场景中,Any2Track的实际表现也全面优于带有域随机化的PPO策略。


随着干扰程度增加,Any2Track的优势愈发明显,这正是具身智能机器人从研发走向商业落地的关键能力。
Any2Track背后的研发团队来自银河通用机器人公司,由清华大学交叉信息研究院助理教授、上海期智研究院PI弋力老师和其团队,以及北京大学助理教授王鹤老师团队共同完成。
从实验室到街头:银河太空舱让机器人真正“干活”
如果说“狂踹不倒”展示的是机器人在实验室里的硬核实力,那么能干活的Galbot则彰显了其在真实世界中的价值。
银河通用已构建了GraspVLA、TrackVLA、GroceryVLA等端到端具身大模型,在精准操作、导航等核心任务上实现了泛化能力的突破。
银河通用的“银河太空舱”,正是将实验室技术推向街头巷尾,让机器人自主服务大众的绝佳载体。
无论是中关村的机器人咖啡师,还是成都春熙路吸引路人驻足的“太空舱”表演者,这些基于具身智能技术的应用,正在逐步融入城市生活。

这些“9平米”的未来便利店,正从中关村起步,扩展到全国多个城市。具身智能机器人不再只是科技展示,而是成为切实的生产力。
例如,十一期间,颐和园的银河太空舱吸引了大量游客体验。

在中国网球公开赛上,银河太空舱也落地现场,带来了前沿的科技体验。

在北京大学助理教授、银河通用机器人创始人及CTO、智源学者王鹤看来:
银河通用机器人正在将智慧零售与创新文旅带入全国街头巷尾与热门景点:轮式人形机器人卖冰饮、咖啡、文创;双足人形机器人热情揽客,把地方特色融入舞蹈和互动。我们期待银河太空舱走向更多城市,人形机器人必将成为中国的又一张国际名片。
全栈自研技术管线:驱动规模化落地
机器人的“狂踹不倒”与“太空舱”里的服务,只是银河通用体系化能力的一部分。
自成立以来,银河通用已形成了从合成数据到多模态具身大模型训练的完整技术管线,并通过以下闭环迭代实现高效落地:
以智能合成大数据与具身大模型为核心,实现“数据生产—模型训练—场景应用”的闭环迭代。
在具身智能领域数据稀缺的背景下,银河通用采用了合成为主、真实为辅的数据范式。通过大规模仿真合成数据辅以少量真实数据,不仅能快速、低成本地生产海量高质量数据,还加速了模型在多场景中的泛化与落地。
基于这一思路,银河通用正积极布局全国化的具身智能训练平台。在基座大模型的基础上,通过打造真实场景的训练平台,积累多样化的垂直场景数据,让人形机器人在特定场景中具备更精细的工作能力。
通过“合成+真实、研发+场景”的双轮驱动,银河通用正推动具身智能在全国范围内的规模化落地,赋能工业、零售、文旅、医疗等多元场景。
人形机器人正加速从实验室走向工厂、商圈与景区。银河通用等先行者,正让中国的人形机器人产业成为面向世界的又一张科技名片。
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,小白也可以简单操作。
评论区