我国科研团队提出全球首个“力位混合控制算法” - 《网络安全与数据治理》（原《信息技术与网络安全》

我国科研团队提出全球首个“力位混合控制算法”
机器人操作成功率提升近 40%

10 月 20 日消息，据央视新闻报道，近日，我国科研团队在机器人算法领域取得重大突破，提出全球首个“力位混合控制算法的统一理论”。

该算法无需依赖力传感器，就能让机器人同时学习位置与力的控制，相关任务成功率较只使用位置控制的策略提高了约 39.5%。更值得关注的是，其相关论文目前已斩获国际机器人学习大会杰出论文奖，这也是该奖项设立以来，首次由全中国籍学者团队摘得。

科研人员介绍，当前广泛应用的视觉-语言-动作模型（VLA），在应对现实生活中的诸多任务时，往往会显得“力不从心”，核心问题就在于这些任务大多涉及复杂的接触场景。比如，擦黑板时，机械臂必须既贴合表面又保持适当的压力；开关柜门，需精准感知内部的推拉弹簧结构。

机器人需要的不仅是“走到哪里”“手伸到哪里”，还需要理解“该用多大的力”。而在没有力位混合控制算法前，这些都需要通过力传感器来解决。

查询获悉，北京通用人工智能研究院提出首个统一的力位混合控制算法，能够在无需力传感器的条件下，同时学习位置与力的控制。

该研究通过强化学习，训练策略从机器人历史状态中估计力，并借助位置与速度调整进行补偿，从而模拟多种位置、力指令及外部扰动。

该策略可实现位置跟踪、施力、力跟踪和柔顺交互等多种操作行为。

此外，力估计模块引入的接触信息提升了基于轨迹的模仿学习效果，在四项接触丰富的操作任务中，成功率比仅使用位置控制的策略提高约 39.5%。

本研究提出了 UniFP（Unified Force and Position Control Policy）。这是足式机器人第一个能够在单一框架下统一处理力与位置的控制算法。它的核心灵感来自阻抗控制。阻抗控制的思想是把机器人末端执行器与环境之间的交互视作一个弹簧–阻尼–质量系统，通过控制偏差来同时调节位置与力。

在 UniFP 中，只考虑末端执行器低速移动的问题，忽略速度和加速度项，把期望的位置、位置指令和力指令、外部的接触力统一写进了一个公式，让策略既能完成轨迹跟随，又能根据接触情况自动调节。同时通过一个力估计器，利用机器人历史状态信息和动作信息估计出受到的合外力。这样一来，机器人不再是“机械地走完路径”，而是能够感知并主动对环境施加力，回应环境。

该研究在 Unitree B2-Z1 四足操控平台和 Unitree G1 人形机器人上开展了七项实验任务。在擦黑板任务中，位置控制的策略要么擦不干净，要么用力过大，而 UniFP 能保持稳定的接触压力，把黑板彻底擦干净。在开关柜门任务中，视觉方法根本无法识别微小的推拉式弹簧，而 UniFP 通过力估计器准确地触发开关。在抽屉被遮挡的场景下，基线方法成功率急剧下降到 0.3，而 UniFP 借助力感知将成功率提升到 0.76。

通知公告

编辑观点

理事会

参考资料

凡《网络安全与数据治理》（原《信息技术与网络安全》）录用的文章，如作者没有关于汇编权、翻译权、印刷权及电子版的复制权、信息网络传播权与发行权等版权的特殊声明，即视作该文章署名作者同意将该文章的汇编权、翻译权、印刷权及电子版的复制权、信息网络传播权与发行权授予本刊，本刊有权授权本刊合作数据库、合作媒体等合作伙伴使用。同时，本刊支付的稿酬已包含上述使用的费用，特此声明。

作者投稿

在线期刊

下载中心

信网杯

《网络安全与数据治理》（原《信息技术与网络安全》）编辑部