Learned Perceptive Forward Dynamics Model for Safe and Platform-aware Robotic Navigation figure
RSS2025Paper 001

Learned Perceptive Forward Dynamics Model for Safe and Platform-aware Robotic Navigation

Pascal Roth, Jonas Frey, Cesar Cadena, Marco Hutter

ETH Zurich † NVIDIA ‡ Max Planck Institute for Intelligent Systems

机器人学习安全导航控制感知腿足机器人

论文针对腿足机器人在复杂地形中导航时,传统简化动力学与手工代价函数既难调参又难反映平台能力的问题,提出感知式前向动力学模型:结合周围高度几何与本体感觉历史,预测多步未来状态及失败风险,并嵌入零样本 MPPI,以更简单代价实现平台相关的安全规划。ANYmal 上其位姿预测较基线平均提升 41%,粗糙地形仿真导航成功率提升 27%,并展示了仿真到现实迁移;但增益分解文中未充分说明,判断受限于 PDF 文本抽取质量。

Demonstrating ViSafe: Vision-enabled Safety for High-speed Detect and Avoid figure
RSS2025Paper 002

Demonstrating ViSafe: Vision-enabled Safety for High-speed Detect and Avoid

Parv Kapoor, Ian Higgins, Nikhil Varma Keetha, Jay Patrikar, Brady Moon, Zelin Ye, Yao He, Ivan Cisneros, Changliu Liu, Eunsuk Kang, Sebastian Scherer

安全感知导航机器人学习自动驾驶触觉

ViSafe 代表的是一条“以感知不确定性为输入、以 CBF 为安全外壳”的 vision-only airborne DAA 路线:它的贡献不在于单个模块更强,而在于把视觉、状态估计和安全控制组织成了一个可部署的闭环。

MISO: Multiresolution Submap Optimization for Efficient Globally Consistent Neural Implicit Reconstruction figure
RSS2025Paper 004

MISO: Multiresolution Submap Optimization for Efficient Globally Consistent Neural Implicit Reconstruction

Yulun Tian, Hanwen Cao, Sunghwan Kim, Nikolay Atanasov

机器人学习SLAM/定位数据基础模型感知

MISO 把大规模 neural SDF SLAM 从“全场几何优化”改造成“多分辨率 submap 的隐空间分层对齐”,核心贡献是用更合理的优化结构换取可扩展性和全局一致性,而不是单纯堆更强的表示或更大的模型。

DRO: Doppler-Aware Direct Radar Odometry with Gyroscope figure
RSS2025Paper 006

DRO: Doppler-Aware Direct Radar Odometry with Gyroscope

Cedric Le Gentil, Leonardo Brizi, Daniil Lisus, Xinyuan Qiao, Giorgio Grisetti, Timothy Barfoot

机器人学习数据SLAM/定位安全强化学习感知

DRO 的位置是:把 spinning radar odometry 从“特征/关联驱动的离散配准”推进到“连续时间、密集强度、gyro/Doppler 物理约束”的直接优化框架,其中真正的进步主要来自建模方式重写,而不是某个单点模块。

Certifiably-Correct Mapping for Safe Navigation Despite Odometry Drift figure
RSS2025Paper 007

Certifiably-Correct Mapping for Safe Navigation Despite Odometry Drift

Devansh R. Agrawal, Rajiv Govindjee, Taekyung Kim, Trushant Adeshara, Jiangbo Yu, Anurekha Ravikumar, Dimitra Panagou

机器人学习SLAM/定位安全导航感知规划

这是把 SLAM/建图从“尽量准确重建世界”推进到“对局部 free space 给出形式化安全证书”的工作,核心贡献是用增量位姿不确定性驱动 safe set 收缩,从而把地图错误从碰撞风险改写成可控的保守遗忘。

π₀: A Vision-Language-Action Flow Model for General Robot Control figure
RSS2025Paper 010

π₀: A Vision-Language-Action Flow Model for General Robot Control

Kevin Black, Noah Brown, Danny Driess, Adnan Esmail, Michael Robert Equi, Chelsea Finn, Niccolo Fusai, Lachy Groom, Karol Hausman, Brian Ichter, Szymon Jakubczak, Tim Jones, Liyiming Ke, Sergey Levine, Adrian Li-Bell, Mohith Mothukuri, Suraj Nair, Karl Pertsch, Lucy Xiaoyang Shi, Laura Smith, James Tanner, Quan Vuong, Anna Walling, Haohuan Wang, Ury Zhilinsky

视觉语言模型基础模型感知灵巧手控制机器人学习

π₀ 代表的是“用预训练 VLM 提供语义先验、再用 flow matching 学连续动作分布”的通用机器人策略路线;它的真正价值更像是把一般机器人控制推进到可扩展的语义条件生成范式,而不是证明了一种全新的规划智能。

SpatialVLA: Exploring Spatial Representations for Visual-Language-Action Models figure
RSS2025Paper 011

SpatialVLA: Exploring Spatial Representations for Visual-Language-Action Models

Delin Qu, Haoming Song, Qizhi Chen, Yuanqi Yao, Xinyi Ye, Jiayuan Gu, Zhigang Wang, Yan Ding, Bin Zhao, Dong Wang, Xuelong Li

视觉语言模型感知基础模型操作机器人学习控制

SpatialVLA 的本质是把 VLA 从“2D 语义驱动的动作生成”改造成“egocentric 3D 对齐的空间模仿系统”,核心贡献在于用空间归纳偏置提升了跨本体、跨场景的操作泛化,而不只是扩大模型或数据。

FAST: Efficient Action Tokenization for Vision-Language-Action Models figure
RSS2025Paper 012

FAST: Efficient Action Tokenization for Vision-Language-Action Models

Karl Pertsch, Kyle Stachowicz, Brian Ichter, Danny Driess, Suraj Nair, Quan Vuong, Oier Mees, Chelsea Finn, Sergey Levine

机器人学习视觉语言模型感知灵巧手数据扩散策略

FAST 是把机器人动作从逐步分桶改造成频域压缩码流的 VLA 前端,它真正推动的是一种“先压缩、后自回归”的动作建模范式,而不是简单的 tokenization 小修小补。

Uni-NaVid: A Video-based Vision-Language-Action Model for Unifying Embodied Navigation Tasks figure
RSS2025Paper 013

Uni-NaVid: A Video-based Vision-Language-Action Model for Unifying Embodied Navigation Tasks

Jiazhao Zhang, Kunyu Wang, Shaoan Wang, Minghan Li, Haoran Liu, Songlin Wei, Zhongyuan Wang, Zhizheng Zhang, He Wang

机器人学习导航视觉语言模型感知数据

Uni-NaVid代表的是一条“用大规模多任务数据和在线记忆压缩,把导航从任务碎片化系统推进到可实时运行的统一VLA policy”的路线,但其增益很可能主要来自数据覆盖、表征共享和工程可部署性,而非某个全新的推理机制。

Learning to Act Anywhere with Task-centric Latent Actions figure
RSS2025Paper 014

Learning to Act Anywhere with Task-centric Latent Actions

Qingwen Bu, Yanting Yang, Jisong Cai, Shenyuan Gao, Guanghui Ren, Maoqing Yao, Ping Luo, Hongyang Li

视觉语言模型数据基础模型机器人学习导航操作

UniVLA 代表的是一条从“依赖动作标注的端到端 VLA”转向“在任务中心 latent action 空间里做跨 embodiment 规划”的路线,其核心贡献是让 web-scale video 真正进入机器人 policy 学习管线。

Unified World Models: Coupling Video and Action Diffusion for Pretraining on Large Robotic Datasets figure
RSS2025Paper 015

Unified World Models: Coupling Video and Action Diffusion for Pretraining on Large Robotic Datasets

Chuning Zhu, Raymond Yu, Siyuan Feng, Benjamin Burchfiel, Paarth Shah, Abhishek Gupta

机器人学习数据扩散策略模仿学习控制生成模型

UWM 的核心贡献是把机器人模仿学习改写成一个可同时吸收动作数据和视频数据的联合扩散世界模型,实质上是在用更强的生成式归纳偏置与数据复用能力,替代纯 BC 对高质量动作标注的依赖。

CLIP-RT: Learning Language-Conditioned Robotic Policies from Natural Language Supervision figure
RSS2025Paper 016

CLIP-RT: Learning Language-Conditioned Robotic Policies from Natural Language Supervision

Gi-Cheon Kang, Junghyun Kim, Kyuhwan Shim, Jun Ki Lee, Byoung-Tak Zhang

感知数据模仿学习视觉语言模型基础模型机器人学习

CLIP-RT 是一条把机器人学习从低层动作模仿重写为语言语义对齐与可扩展数据采集的路线:核心贡献不在更大模型,而在用自然语言重构监督和动作表示,从而提升新技能学习的可迁移性与采集可扩展性。

NaVILA: Legged Robot Vision-Language-Action Model for Navigation figure
RSS2025Paper 018

NaVILA: Legged Robot Vision-Language-Action Model for Navigation

An-Chieh Cheng, Yandong Ji, Zhaojing Yang, Zaitian Gongye, Xueyan Zou, Jan Kautz, Erdem Biyik, Hongxu Yin, Sifei Liu, Xiaolong Wang

机器人学习腿足机器人视觉语言模型感知导航强化学习

NaVILA把腿足机器人VLN从“VLM直接学控制”改成“VLM生成语言化中层计划、专用控制器负责执行”的两层范式,核心贡献是用动作表示重构来换取更好的泛化、可迁移性和真实部署鲁棒性。

ConRFT: A Reinforced Fine-tuning Method for VLA Models via Consistency Policy figure
RSS2025Paper 019

ConRFT: A Reinforced Fine-tuning Method for VLA Models via Consistency Policy

Yuhui Chen, Shuai Tian, Shugao Liu, Yingting Zhou, Haoran Li, Dongbin Zhao

机器人学习视觉语言模型触觉模仿学习操作强化学习

ConRFT 是把 VLA 微调从纯监督适配推进到“离线示范 + 价值约束 + 在线受控改进”的 reinforced fine-tuning 路线,核心价值在于用一致性 policy 把真机小样本 RL 变得可行,但其增益是否超越数据覆盖与系统工程仍需更强验证。

Demonstrating MuJoCo Playground figure
RSS2025Paper 020

Demonstrating MuJoCo Playground

Kevin Zakka, Baruch Tabanpour, Qiayuan Liao, Mustafa Haiderbhai, Samuel Holt, Jing Yuan Luo, Arthur Allshire, Erik Frey, Koushil Sreenath, Lueder Alexander Kahrs, Carmelo Sferrazza, Yuval Tassa, Pieter Abbeel

灵巧手腿足机器人仿真到现实机器人学习

这是一篇把 MuJoCo/MJX、批量渲染和真机控制整合成统一 GPU 原生工作流的系统论文,其核心贡献是显著降低机器人 sim-to-real 的迭代成本,而不是提出新的学习算法。

Demonstrating GPU Parallelized Robot Simulation and Rendering for Generalizable Embodied AI with ManiSkill3 figure
RSS2025Paper 021

Demonstrating GPU Parallelized Robot Simulation and Rendering for Generalizable Embodied AI with ManiSkill3

Stone Tao, Fanbo Xiang, Arth Shukla, Yuzhe Qin, Xander Hinrichsen, Xiaodi Yuan, Chen Bao, Xinsong Lin, Yulin Liu, Tse-Kai Chan, Yuan Gao, Xuanlin Li, Tongzhou Mu, Nan Xiao, Arnav Gurha, Viswesh Nagaswamy Rajesh, Yong Woo Choi, Yen-Ru Chen, Zhiao Huang, Roberto Calandra, Rui Chen, Shan Luo, Hao Su

操作强化学习模仿学习感知机器人学习导航

ManiSkill3 不是一篇“新算法”论文,而是把机器人学习从窄场景、低吞吐的仿真范式推进到可做多任务异构大规模训练的平台级工作,其核心贡献是系统 scaling 与分布扩张,而非新的控制或学习理论。

RoboVerse: A Unified Platform, Benchmark and Dataset for Scalable and Generalizable Robot Learning figure
RSS2025Paper 022

RoboVerse: A Unified Platform, Benchmark and Dataset for Scalable and Generalizable Robot Learning

Haoran Geng, Feishi Wang, Songlin Wei, Yuyang Li, Bangjun Wang, Boshi An, Haozhe Lou, Charlie Tianyue Cheng, Peihao Li, Haozhe Chen, Yutong Liang, Yuxi Qian, Jiageng Mao, Weikang Wan, Yiran Geng, Mingtong Zhang, Jiangran Lyu, Siheng Zhao, Jiazhao Zhang, Chaoyi Xu, Jialiang Zhang, Chengyang Zhao, Haoran Lu, Yufei Ding, Ran Gong, Yuran Wang, Yuxuan Kuang, Ruihai Wu, Baoxiong Jia, Hao Dong, Siyuan Huang, Yue Wang, Jitendra Malik, Pieter Abbeel

数据机器人学习强化学习模仿学习触觉导航

RoboVerse 不是提出新 policy 的论文,而是用统一仿真接口 + 大规模合成数据 + 标准化 benchmark,把机器人学习从碎片化实验推进到可规模化、可复用、可比较的基础设施路线。

Robot Data Curation with Mutual Information Estimators figure
RSS2025Paper 023

Robot Data Curation with Mutual Information Estimators

Joey Hejna, Suvir Mirchandani, Ashwin Balakrishna, Annie Xie, Ayzaan Wahid, Jonathan Tompson, Pannag R. Sanketi, Dhruv Shah, Coline Manon Devin, Dorsa Sadigh

机器人学习数据模仿学习感知灵巧手

这篇论文把机器人演示数据筛选从“看起来像专家”推进到“对 state-action 互信息的贡献有多大”,本质上是一个面向小数据机器人场景的统计型 curation 方法,而非新的模仿学习范式。

Robot Learning with Super-Linear Scaling figure
RSS2025Paper 025

Robot Learning with Super-Linear Scaling

Marcel Torne Villasevil, Arhan Jain, Jiayi Yuan, Vidyaaranya Macha, Lars Lien Ankile, Anthony Simeonov, Pulkit Agrawal, Abhishek Gupta

数据机器人学习基础模型模仿学习操作强化学习

这篇工作把机器人学习从“人类提供数据、模型去拟合”推进到“模型逐步接管数据生成”的自举式范式,真正贡献是一个面向真实场景的、以扫描和蒸馏驱动的可摊薄人力成本的数据飞轮。

Action Flow Matching for Lifelong Learning figure
RSS2025Paper 026

Action Flow Matching for Lifelong Learning

Alejandro Murillo-González, Lantao Liu

控制安全数据机器人学习自动驾驶灵巧手

AFM 把 continual robot learning 从“在失配动力学上继续探索并修模型”改写成“先用 flow matching 校正动作意图,再用更有信息的数据反向对齐模型”,属于动作层数据重分布而非纯参数更新的一类方法。

Solving Multi-Agent Safe Optimal Control with Distributed Epigraph Form MARL figure
RSS2025Paper 027

Solving Multi-Agent Safe Optimal Control with Distributed Epigraph Form MARL

Songyuan Zhang, Oswin So, Mitchell Black, Zachary Serlin, Chuchu Fan

机器人学习安全强化学习多机器人控制触觉

这是把 multi-agent hard safety 的核心难题从“调权衡”改成“找可行上界并可分解执行”的一类结构化 safe MARL 方法,核心贡献在于 epigraph 重写与分布式可解性证明,而不是新的策略学习模块。

LiDAR Registration with Visual Foundation Models figure
RSS2025Paper 031

LiDAR Registration with Visual Foundation Models

Niclas Vödisch, Giovanni Cioffi, Marco Cannici, Wolfram Burgard, Davide Scaramuzza

感知基础模型机器人学习灵巧手数据SLAM/定位

这篇论文把长期LiDAR配准从“学习3D几何描述子”改写为“用DINOv2视觉表征做点匹配,再交给传统几何求解”,核心贡献是证明视觉基础模型能显著抬高长期注册中的对应质量与泛化上限。

Building Rome with Convex Optimization figure
RSS2025Paper 032

Building Rome with Convex Optimization

Haoyu Han, Heng Yang

感知

这篇论文属于“用 learned 3D 先验重写经典 BA,再借助 SDP/BM 做全局可扩展求解”的路线,真正贡献是把原本依赖初始化的非凸几何估计问题改造成了一个更容易被全局优化处理的 lifted optimization problem。

Demonstrating MOSART: Opening Articulated Structures in the Real World figure
RSS2025Paper 033

Demonstrating MOSART: Opening Articulated Structures in the Real World

Arjun Gupta, Michelle Zhang, Rishik Sathua, Saurabh Gupta

机器人学习操作移动操作模仿学习基础模型数据

这是一篇把 articulated object opening 当作真实世界 mobile manipulation 试金石的系统论文:它用模块化几何先验证明了,在当前数据与视角条件下,结构化系统比端到端学习更接近可部署的泛化。

Vysics: Object Reconstruction Under Occlusion by Fusing Vision and Contact-Rich Physics figure
RSS2025Paper 034

Vysics: Object Reconstruction Under Occlusion by Fusing Vision and Contact-Rich Physics

Bibit Bianchini, Minghan Zhu, Mengti Sun, Bowen Jiang, Camillo Jose Taylor, Michael Posa

机器人学习感知控制触觉操作SLAM/定位

Vysics 把遮挡下的对象重建从纯视觉补全,推进为“用接触动力学反推隐藏几何”的机器人建模框架,其主要贡献是一个更适合 manipulation 场景的几何-物理统一 inductive bias,而不是单纯的模块堆叠。

Implicit Neural-Representation Learning for Elastic Deformable-Object Manipulations figure
RSS2025Paper 035

Implicit Neural-Representation Learning for Elastic Deformable-Object Manipulations

Jeongho Ha, Minseok Song, Bonggyeong Park, Daehyung Park

操作强化学习机器人学习感知触觉

这是一篇把弹性物体操作从“直接学控制”转成“先学可补全的隐式几何状态、再用 RL 对齐任务”的方法论文,本质贡献是为部分可见软体操作提供了更强的状态归纳偏置,而非提出了新的控制范式。

V-HOP: Visuo-Haptic 6D Object Pose Tracking figure
RSS2025Paper 037

V-HOP: Visuo-Haptic 6D Object Pose Tracking

Hongyu Li, Mingxi Jia, Mete Tuluhan Akbulut, Yu Xiang, George Konidaris, Srinath Sridhar

触觉感知灵巧手数据操作仿真到现实

V-HOP 的位置不是“又一个 vision+tactile 融合模型”,而是把多模态 6D tracking 推向“跨 embodiment 表征对齐 + 时序状态估计”的路线,真正解决真实操作里传感器异构和单帧不稳定这两个根瓶颈。

Joint State and Noise Covariance Estimation figure
RSS2025Paper 038

Joint State and Noise Covariance Estimation

Kasra Khosoussi, Iman Shames

机器人学习感知SLAM/定位

这是一篇把 SLAM/视觉中的噪声协方差从手工超参数提升为可解析在线估计变量的论文,核心贡献是用约束 ML/MAP 让“状态—权重”联合优化变成可落地、可接现有求解器的统计更新框架。

Map Space Belief Prediction for Manipulation-Enhanced Mapping figure
RSS2025Paper 039

Map Space Belief Prediction for Manipulation-Enhanced Mapping

Joao Marcos Correia Marques, Nils Dengler, Jesper Mücke, Tobias Zaenker, Shenlong Wang, Maren Bennewitz, Kris Hauser

机器人学习操作SLAM/定位规划

这是一篇把机械搜索式的“看/动”决策重写成 calibrated map-belief propagation 的工作,本质贡献是用空间化世界模型把主动感知、操作后果预测和信息增益规划统一起来,而不是单纯做更强的视点选择。

Bilevel Learning for Bilevel Planning figure
RSS2025Paper 043

Bilevel Learning for Bilevel Planning

Bowen Li, Tom Silver, Sebastian Scherer, Alexander G. Gray

机器人学习规划操作模仿学习灵巧手移动操作

这是把 bilevel planning 从“手工抽象上做规划”推进到“抽象本身也要被学习并受规划反向约束”的工作,核心贡献是为机器人组合泛化提供了一个更可扩展的神经-符号闭环。

Efficient Hierarchical Any-Angle Path Planning on Multi-Resolution 3D Grids figure
RSS2025Paper 049

Efficient Hierarchical Any-Angle Path Planning on Multi-Resolution 3D Grids

Victor Reijgwart, Cesar Cadena, Roland Siegwart, Lionel Ott

机器人学习规划导航感知基础模型数据

这是一篇把 Theta* 的 any-angle 几何最优性与 octree 的层级压缩真正融合起来的规划工作:核心贡献是用区域级 predecessor 传播和按歧义细化,把 3D Euclidean 全局规划从“高分辨率图搜索”变成“稀疏结构上的递归最短路”。

Differentiable GPU-Parallelized Task and Motion Planning figure
RSS2025Paper 050

Differentiable GPU-Parallelized Task and Motion Planning

William Shen, Caelan Reed Garrett, Nishanth Kumar, Ankit Goyal, Tucker Hermans, Leslie Pack Kaelbling, Tomás Lozano-Pérez, Fabio Ramos

机器人学习规划导航安全操作灵巧手

cuTAMP 不是在 TAMP 里提出一种更强的单次求解器,而是把离散骨架搜索和连续约束求解重构为 GPU 上的大规模并行 test-time 搜索,从而用“覆盖多个 basin + 可微精修”替代传统串行采样/优化的脆弱性。

Flow Matching Ergodic Coverage figure
RSS2025Paper 051

Flow Matching Ergodic Coverage

Max Muchen Sun, Allison Pinosky, Todd Murphey

机器人学习控制生成模型灵巧手

它把 ergodic coverage 从“只能用少数手工 metric 的轨迹优化”升级为“可匹配任意 reference flow 的 LQ flow matching 框架”,本质上是一次把生成模型几何引入控制 synthesis 的接口层创新。

Reactive Diffusion Policy: Slow-Fast Visual-Tactile Policy Learning for Contact-Rich Manipulation figure
RSS2025Paper 052

Reactive Diffusion Policy: Slow-Fast Visual-Tactile Policy Learning for Contact-Rich Manipulation

Han Xue, Jieji Ren, Wendi Chen, Gu Zhang, Fang Yuan, Guoying Gu, Huazhe Xu, Cewu Lu

触觉感知扩散策略操作机器人学习模仿学习

这是一篇把 contact-rich 模仿学习从“开环动作块预测”推进到“慢速轨迹规划 + 高频触觉闭环纠偏”的工作,核心贡献是新的时间尺度分解,而不只是更大模型或更多传感器。

Physics-Driven Data Generation for Contact-Rich Manipulation via Trajectory Optimization figure
RSS2025Paper 053

Physics-Driven Data Generation for Contact-Rich Manipulation via Trajectory Optimization

Lujie Yang, H.j. Terry Suh, Tong Zhao, Bernhard Paus Graesdal, Tarik Kelestemur, Jiuguang Wang, Tao Pang, Russ Tedrake

机器人学习数据操作规划生成模型灵巧手

这是一篇把“人类示范 + 物理约束优化”用作数据生成器的论文:它真正贡献的不是新 policy,而是让少量 demo 通过 trajectory optimization 被放大成跨 embodiment 的可执行接触数据分布。

PP-Tac: Paper Picking Using Omnidirectional Tactile Feedback in Dexterous Robotic Hands figure
RSS2025Paper 056

PP-Tac: Paper Picking Using Omnidirectional Tactile Feedback in Dexterous Robotic Hands

Pei Lin, Yuzhe Huang, Jianpeng Ma, Chenxi Xiao, Wanlin Li, Ziyuan Jiao

机器人学习灵巧手触觉操作感知控制

PP-Tac 是一条把纸类拾取从视觉驱动抓取改写为触觉闭环接触控制的路线,真正贡献在于用全向触觉把高滑移变形任务变成可在线纠偏的问题,而 diffusion 轨迹学习更像是在这个控制框架上补足动作先验。

Demonstrating the Octopi-1.5 Visual-Tactile-Language Model figure
RSS2025Paper 058

Demonstrating the Octopi-1.5 Visual-Tactile-Language Model

Samson Yu, Lin Kelvin, Harold Soh

机器人学习触觉灵巧手感知视觉语言模型模仿学习

Octopi-1.5 代表的是一种把触觉感知、语言常识和检索记忆拼成可教学推理系统的演化路线,但目前更像是强 backbone + memory augmentation 的系统集成,而非触觉理解本身的理论突破。

Robust Peg-in-Hole Assembly under Uncertainties via Compliant and Interactive Contact-Rich Manipulation figure
RSS2025Paper 060

Robust Peg-in-Hole Assembly under Uncertainties via Compliant and Interactive Contact-Rich Manipulation

Yiting Chen, Kenneth Kimble, Howard H. Qian, Podshara Chanrungmaneekul, Robert Seney, Kaiyu Hang

机器人学习操作安全人机交互感知

这是一篇把 peg-in-hole 从“精确规划问题”重写为“通过受控接触逐步收缩不确定性的问题”的论文,核心贡献是用 manipulation funnel 把感知与执行统一成同一种约束吸收机制。

AMO: Adaptive Motion Optimization for Hyper-Dexterous Humanoid Whole-Body Control figure
RSS2025Paper 061

AMO: Adaptive Motion Optimization for Hyper-Dexterous Humanoid Whole-Body Control

Jialong Li, Xuxin Cheng, Tianshu Huang, Shiqi Yang, Ri-Zhao Qiu, Xiaolong Wang

机器人学习腿足机器人灵巧手控制强化学习操作

AMO 的位置是:它不是在 humanoid whole-body control 上再做一个 policy,而是通过重构训练 reference 和命令空间,把“能到哪里、怎么稳地到”这件事从窄步态 imitation 推进到可扩 workspace 的连续泛化控制。

Demonstrating Berkeley Humanoid Lite: An Open-source, Accessible, and Customizable 3D-printed Humanoid Robot figure
RSS2025Paper 062

Demonstrating Berkeley Humanoid Lite: An Open-source, Accessible, and Customizable 3D-printed Humanoid Robot

Yufeng Chi, Qiayuan Liao, Junfeng Long, Xiaoyu Huang, Sophia Shao, Borivoje Nikolic, Zhongyu Li, Koushil Sreenath

机器人学习腿足机器人感知强化学习触觉控制

这是一篇把 humanoid 研究从封闭高门槛硬件,推进到开放、低成本、可复现平台的基础设施型论文,其核心价值是重构研究入口,而不是刷新控制算法本身。

Learning Getting-Up Policies for Real-World Humanoid Robots figure
RSS2025Paper 063

Learning Getting-Up Policies for Real-World Humanoid Robots

Xialin He, Runpei Dong, Zixuan Chen, Saurabh Gupta

机器人学习腿足机器人安全控制灵巧手强化学习

这篇论文把 humanoid 起身从“直接学控制”改成“先发现恢复轨迹、再蒸馏成可部署策略”的 curriculum 学习问题,证明了在复杂接触场景下,真正有效的提升主要来自任务分解与 inductive bias,而不只是更大规模的 RL。

Learning Humanoid Standing-up Control across Diverse Postures figure
RSS2025Paper 064

Learning Humanoid Standing-up Control across Diverse Postures

Tao Huang, Junli Ren, Huayi Wang, Zirui Wang, Qingwei Ben, Muning Wen, Xiao Chen, Jianan Li, Jiangmiao Pang

机器人学习控制腿足机器人安全操作移动操作

HoST 代表的是一种把 humanoid 起身从“轨迹执行”改写为“受限姿态泛化 RL”的方法演化:核心贡献是通过分布覆盖和动作约束,让站起策略第一次看起来像能真机落地的恢复控制器,而不是只在仿真里成立的动作模板。

LangWBC: Language-directed Humanoid Whole-Body Control via End-to-end Learning figure
RSS2025Paper 065

LangWBC: Language-directed Humanoid Whole-Body Control via End-to-end Learning

Yiyang Shao, Bike Zhang, Qiayuan Liao, Xiaoyu Huang, Yuman Gao, Yufeng Chi, Zhongyu Li, Sophia Shao, Koushil Sreenath

机器人学习腿足机器人控制强化学习触觉

LangWBC 本质上是把“文本到动作”的问题从轨迹生成改写成带物理先验的闭环 latent control:它的贡献更像是用 CVAE + RL teacher 重建了一个可被语言索引的 humanoid 动作流形,而不是单纯做了一个更强的 text-to-motion 模型。

ASAP: Aligning Simulation and Real-World Physics for Learning Agile Humanoid Whole-Body Skills figure
RSS2025Paper 066

ASAP: Aligning Simulation and Real-World Physics for Learning Agile Humanoid Whole-Body Skills

Tairan He, Jiawei Gao, Wenli Xiao, Yuanhang Zhang, Zi Wang, Jiashun Wang, Zhengyi Luo, Guanqi He, Nikhil Sobanbabu, Chaoyi Pan, Zeji Yi, Guannan Qu, Kris Kitani, Jessica K. Hodgins, Linxi Fan, Yuke Zhu, Changliu Liu, Guanya Shi

机器人学习控制腿足机器人仿真到现实数据基础模型

ASAP 是一条把 sim-to-real mismatch 重新表述为动作残差对齐问题的 humanoid 控制路线:它的真正贡献在于用真实数据把仿真环境校正到更接近可执行控制,而不是去逼近一个完整、精确的物理世界模型。

A Unified and General Humanoid Whole-Body Controller for Fine-Grained Locomotion figure
RSS2025Paper 067

A Unified and General Humanoid Whole-Body Controller for Fine-Grained Locomotion

Yufei Xue, Wentao Dong, Minghuan Liu, Weinan Zhang, Jiangmiao Pang

机器人学习腿足机器人控制可解释性操作移动操作

HuGWBC 的位置是:把 humanoid whole-body locomotion 从“单一跟踪型控制”推进到“命令空间驱动的可组合控制”,其真正贡献在于用统一命令空间和干预鲁棒训练把多步态、细粒度姿态调节与上半身外部接管整合到同一个可部署策略里。

BeamDojo: Learning Agile Humanoid Locomotion on Sparse Footholds figure
RSS2025Paper 068

BeamDojo: Learning Agile Humanoid Locomotion on Sparse Footholds

Huayi Wang, Zirui Wang, Junli Ren, Qingwei Ben, Tao Huang, Weinan Zhang, Jiangmiao Pang

腿足机器人强化学习操作机器人学习安全感知

BeamDojo 不是把 humanoid sparse foothold locomotion 做成了更大的 RL,而是通过 polygonal-foot reward 重写、双 critic 解耦和两阶段 curriculum,把一个几乎不可学的稀疏接触问题变成了可探索、可部署的策略学习问题。

HOMIE: Humanoid Loco-Manipulation with Isomorphic Exoskeleton Cockpit figure
RSS2025Paper 070

HOMIE: Humanoid Loco-Manipulation with Isomorphic Exoskeleton Cockpit

Qingwei Ben, Feiyu Jia, Jia Zeng, Junting Dong, Dahua Lin, Jiangmiao Pang

控制腿足机器人操作移动操作灵巧手强化学习

HOMIE 不是又一个 humanoid teleop 装置,而是用“RL 接管下半身 + 同构外骨骼直接映射上半身 + 传感手套接管手部”的结构化重分工,把 humanoid loco-manipulation 从高噪声反演问题改造成可高频、低损耗的数据飞轮。

Curating Demonstrations using Online Experience figure
RSS2025Paper 071

Curating Demonstrations using Online Experience

Annie S. Chen, Alec M. Lessing, Yuejiang Liu, Chelsea Finn

机器人学习模仿学习数据操作灵巧手

这篇论文把 demonstration curation 从人工经验和静态损失,推进到基于机器人在线成败反馈的策略可靠性筛选,本质上是在做 embodiment-aware 的数据重写,而不是单纯训练更强的 imitation policy。

CodeDiffuser: Attention-Enhanced Diffusion Policy via VLM-Generated Code for Instruction Ambiguity figure
RSS2025Paper 072

CodeDiffuser: Attention-Enhanced Diffusion Policy via VLM-Generated Code for Instruction Ambiguity

Guang Yin, Yitong Li, Yixuan Wang, Dale Mcconachie, Paarth Shah, Kunimatsu Hashimoto, Huan Zhang, Katherine Liu, Yunzhu Li

机器人学习视觉语言模型操作感知扩散策略可解释性

CodeDiffuser 的定位是:用 VLM 生成可执行代码来显式消解语言歧义,再把语义转成 3D 注意力去约束 diffusion policy,本质上是在机器人操控里用“程序化 grounding”替代黑盒端到端语义-动作耦合。

Can We Detect Failures Without Failure Data? Uncertainty-Aware Runtime Failure Detection for Imitation Learning Policies figure
RSS2025Paper 073

Can We Detect Failures Without Failure Data? Uncertainty-Aware Runtime Failure Detection for Imitation Learning Policies

Chen Xu, Tony Khuong Nguyen, Emma Dixon, Christopher Rodriguez, Patrick Miller, Robert Lee, Paarth Shah, Rares Andrei Ambrus, Haruki Nishimura, Masha Itkina

感知模仿学习数据操作机器人学习安全

这是一篇把机器人 failure detection 从“依赖 failure supervision 的分类问题”重构为“只用成功数据做顺序 OOD 监控”的工作,核心价值在于建模转向与可校准的 runtime 安全预警,而非单纯的 detector engineering。

Unified Video Action Model figure
RSS2025Paper 074

Unified Video Action Model

Shuang Li, Yihuai Gao, Dorsa Sadigh, Shuran Song

生成模型机器人学习控制扩散策略感知

UVA 的位置是:把视频当作控制表征学习的监督源、把动作当作独立推理目标,用共享 latent + 推理解耦把 video-based policy 从慢而脆的级联生成,推进到一个更实用的统一多模态控制框架。

DexWild: Dexterous Human Interactions for In-the-Wild Robot Policies figure
RSS2025Paper 075

DexWild: Dexterous Human Interactions for In-the-Wild Robot Policies

Tony Tao, Mohan Kumar Srirama, Jason Jingzhou Liu, Kenneth Shaw, Deepak Pathak

机器人学习数据灵巧手人机交互操作模仿学习

DexWild 代表的是一类“用大规模自然人类交互补场景覆盖、用少量机器人数据做执行对齐”的 dexterous manipulation 路线,其核心贡献是数据范式和跨 embodiment 训练组织方式,而不是新的控制算法。

From Foresight to Forethought: VLM-In-the-Loop Policy Steering via Latent Alignment figure
RSS2025Paper 076

From Foresight to Forethought: VLM-In-the-Loop Policy Steering via Latent Alignment

Yilin Wu, Thomas Tian, Gokul Swamy, Andrea Bajcsy

机器人学习视觉语言模型生成模型操作模仿学习感知

这是一篇把 VLM 从“直接看机器人动作做判断”改造成“先由 latent world model 预测后果、再由 VLM 以语言语义做选择”的 policy steering 工作,本质贡献是用表示对齐来修补生成式机器人控制中的预测-评估鸿沟。

Is Your Imitation Learning Policy Better than Mine? Policy Comparison with Near-Optimal Stopping figure
RSS2025Paper 077

Is Your Imitation Learning Policy Better than Mine? Policy Comparison with Near-Optimal Stopping

David Snyder, Asher James Hancock, Apurva Badithela, Emma Dixon, Patrick Miller, Rares Andrei Ambrus, Anirudha Majumdar, Masha Itkina, Haruki Nishimura

机器人学习模仿学习操作安全灵巧手数据

这是一篇把机器人 policy comparison 从固定样本的 batch testing 重写为近最优 sequential stopping 的统计方法论文,核心贡献是用更合理的停止机制在小样本、高成本评估中省 trial、保正确性,而不是提出新的学习器。

DDAT: Diffusion Policies Enforcing Dynamically Admissible Robot Trajectories figure
RSS2025Paper 078

DDAT: Diffusion Policies Enforcing Dynamically Admissible Robot Trajectories

Jean-Baptiste Bouvier, Kanghyun Ryu, Qiayuan Liao, Koushil Sreenath, Negar Mehr

机器人学习扩散策略安全生成模型触觉规划

DDAT 把 diffusion policy 从“生成看起来合理的轨迹”推进到“在训练和推理中都被局部动力学可达性约束塑形的轨迹生成器”,其真正贡献是用投影几何重写了扩散轨迹规划的 inductive bias,而不是单纯堆一个约束模块。

FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization figure
RSS2025Paper 083

FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization

Rajat Kumar Jenamani, Tom Silver, Ben Dodson, Shiqin Tong, Anthony Song, Yuting Yang, Ziang Liu, Benjamin Howe, Aimee Whitneck, Tapomayukh Bhattacharjee

机器人学习安全视觉语言模型多机器人人机交互

FEAST 代表的是一种把照护机器人个性化从黑箱策略学习转向“用户可编辑、可验证、可解释的行为程序”的方法演化,而它的价值主要来自这种受约束的表示与交互设计,而不是 LLM 本身。

Demonstrating a Control Framework for Physical Human-Robot Interaction Toward Industrial Applications figure
RSS2025Paper 084

Demonstrating a Control Framework for Physical Human-Robot Interaction Toward Industrial Applications

Bastien Muraccioli, Mathieu Celerier, Mehdi Benallegue, Gentiane Venture

机器人学习控制人机交互安全触觉

这篇论文把 pHRI 从“柔顺控制演示”推进到“带安全约束的工业级控制架构原型”,真正贡献是用 QP 层次化地统一了任务精度、可切换柔顺和底层扭矩执行,但其泛化性仍明显依赖高质量系统辨识与平台定制。

Optimal Interactive Learning on the Job via Facility Location Planning figure
RSS2025Paper 087

Optimal Interactive Learning on the Job via Facility Location Planning

Shivam Vats, Michelle D. Zhao, Patrick Callaghan, Mingxi Jia, Maxim Likhachev, Oliver Kroemer, George Konidaris

规划机器人学习操作灵巧手多机器人人机交互

这是一篇把多任务交互学习重写成设施选址式全局成本规划的工作,核心贡献是用可近似的 OR 结构替代单任务主动学习式的局部 query 选择,从而实现更省人的长期协作。

Interruption Handling for Conversational Robots figure
RSS2025Paper 089

Interruption Handling for Conversational Robots

Shiye Cao, Jiwon Moon, Amama Mahmood, Victor Nikhil Antony, Ziang Xiao, Anqi Liu, Chien-Ming Huang

机器人学习灵巧手人机交互视觉语言模型数据控制

这是一篇把 interruption 从“turn-taking 失败”重构为“语用意图驱动的在线对话控制”的系统论文,核心贡献在于 policy 设计与人类交互范式迁移,而不是单纯的检测或生成。

Demonstrating Arena 5.0: A Photorealistic ROS2 Simulation Framework for Developing and Benchmarking Social Navigation figure
RSS2025Paper 092

Demonstrating Arena 5.0: A Photorealistic ROS2 Simulation Framework for Developing and Benchmarking Social Navigation

Linh Kästner, Volodymyr Shcherbyna, Harold Soh, Giang Nguyen Huu Truong, Do Duc Anh, Ton Manh Kien, Tim Seeger, Ahmed Martban, Vu Thanh Lam, Nguyen Quoc Hung, Pham Thai Hoang Tung, Tran Dang An, Eva Wiese, Maximilian Ho-Kyoung Schreff

机器人学习导航生成模型规划

Arena 5.0 不是一个新导航方法,而是把 social navigation 研究从低保真、碎片化的仿真测试,推进到 ROS2 对齐、可扩展、可 benchmark 的高保真实验基础设施。

Safety with Agency: Human-Centered Safety Filter with Application to AI-Assisted Motorsports figure
RSS2025Paper 093

Safety with Agency: Human-Centered Safety Filter with Application to AI-Assisted Motorsports

Donggeon David Oh, Justin Lidard, Haimin Hu, Himani Sinhmar, Elle Lazarski, Deepak Edakkattil Gopinath, Emily Sumner, Jonathan Decastro, Guy Rosman, Naomi Leonard, Jaime Fernández Fisac

安全人机交互控制自动驾驶可解释性数据

这篇工作把共享自治里的安全过滤器从“最后时刻接管”改造成“基于学习到的安全值函数、对人类意图做最小侵入投影的 model-free 安全约束控制”,核心贡献是把安全与 agency 同时纳入同一个干预几何里。

Resolving Conflicting Constraints in Multi-Agent Reinforcement Learning with Layered Safety figure
RSS2025Paper 094

Resolving Conflicting Constraints in Multi-Agent Reinforcement Learning with Layered Safety

Jasmine Jerry Aloor, Jason Jangho Choi, Jingqi Li, Maria G. Mendoza, Hamsa Balakrishnan, Claire Tomlin

机器人学习安全强化学习多机器人触觉人机交互

这是一篇把多智能体安全从“统一硬约束求解”推进到“冲突稀疏化 + 局部安全修正”的分层式 MARL 论文,核心贡献是重构了安全与学习的职责分配,而不是单纯堆了一个 safety module。

FERMI: Flexible Radio Mapping with a Hybrid Propagation Model and Scalable Autonomous Data Collection figure
RSS2025Paper 095

FERMI: Flexible Radio Mapping with a Hybrid Propagation Model and Scalable Autonomous Data Collection

Yiming Luo, Yunfei Wang, Hongming Chen, Chengkai Wu, Ximin Lyu, Jinni Zhou, Jun Ma, Fu Zhang, Boyu Zhou

机器人学习数据SLAM/定位多机器人人机交互规划

FERMI 是把 radio mapping 从端到端黑箱拟合重构为“物理先验残差学习 + 多机器人并行采集”的结构化方案,核心贡献在于提升稀疏数据下的外推与构图效率,而不是单纯提高回归精度。

How to Coordinate UAVs and UGVs for Efficient Mission Planning? Optimizing Energy-Constrained Cooperative Routing with a DRL Framework figure
RSS2025Paper 101

How to Coordinate UAVs and UGVs for Efficient Mission Planning? Optimizing Energy-Constrained Cooperative Routing with a DRL Framework

Mohammad Safwan Mondal, Subramanian Ramasamy, Pranav Bhounsule

强化学习规划多机器人自动驾驶安全触觉

这篇论文把 UAV-UGV 协同规划从全局联合优化重构为 sortie 级的异构序列决策,用 transformer + 可行性约束实现了更可扩展的学习式调度/路由器,但其核心增益更像是结构化分解与搜索预算,而非纯粹的端到端推理突破。

DexterityGen: Foundation Controller for Unprecedented Dexterity figure
RSS2025Paper 103

DexterityGen: Foundation Controller for Unprecedented Dexterity

Zhao-Heng Yin, Changhao Wang, Luis Pineda, Francois Robert Hogan, Chaithanya Krishna Bodduluri, Akash Sharma, Patrick Lancaster, Ishita Prasad, Mrinal Kalakrishnan, Jitendra Malik, Mike Lambeta, Tingfan Wu, Pieter Abbeel, Mustafa Mukadam

机器人学习灵巧手控制强化学习操作数据

DexterityGen 本质上是把灵巧操作做成一个可被高层提示调用的生成式低层动作先验;它的贡献更像是数据覆盖驱动的控制架构重组,而不是单纯的单任务 policy 提升。

DOGlove: Dexterous Manipulation with a Low-Cost Open-Source Haptic Force Feedback Glove figure
RSS2025Paper 104

DOGlove: Dexterous Manipulation with a Low-Cost Open-Source Haptic Force Feedback Glove

Han Zhang, Songbo Hu, Zhecheng Yuan, Huazhe Xu

机器人学习触觉灵巧手操作人机交互模仿学习

DOGlove 代表的是一条“用低成本闭环触觉/力反馈接口提升灵巧手遥操作与示范质量”的系统路线,其真正贡献是把 contact-rich manipulation 的关键状态重新嵌回人的感觉回路,而非提出新的学习算法。

Dex1B: Learning with 1B Demonstrations for Dexterous Manipulation figure
RSS2025Paper 106

Dex1B: Learning with 1B Demonstrations for Dexterous Manipulation

Jianglong Ye, Keyi Wang, Chengjing Yuan, Ruihan Yang, Yiquan Li, Jiyue Zhu, Yuzhe Qin, Xueyan Zou, Xiaolong Wang

机器人学习模仿学习灵巧手数据操作生成模型

Dex1B 的本质是把灵巧操作从“小规模优化示范学习”推进到“带几何归纳偏置的迭代式数据扩张”,其核心贡献更像一个可扩展的数据生产范式,而不是单纯一个更大的数据集。

Demonstrating Multi-Suction Item Picking at Scale via Multi-Modal Learning of Pick Success figure
RSS2025Paper 107

Demonstrating Multi-Suction Item Picking at Scale via Multi-Modal Learning of Pick Success

Che Wang, Jeroen Vanbaar, Chaitanya Mitash, Shuai Li, Dylan Randle, Weiyao Wang, Sumedh Anand Sontakke, Kostas Bekris, Kapil Katyal

机器人学习操作数据感知安全

这是一个典型的工业机器人表征学习升级案例:用域内多模态预训练+条件化读出,把原本依赖人工特征的抓取成功判别,推进到可从真实执行日志中规模化学习的任务相关表示。

Sim-and-Real Co-Training: A Simple Recipe for Vision-Based Robotic Manipulation figure
RSS2025Paper 109

Sim-and-Real Co-Training: A Simple Recipe for Vision-Based Robotic Manipulation

Abhiram Maddukuri, Zhenyu Jiang, Lawrence Yunliang Chen, Soroush Nasiriany, Yuqi Xie, Yu Fang, Wenqi Huang, Zu Wang, Zhenjia Xu, Nikita Chernyadev, Scott Reed, Ken Goldberg, Ajay Mandlekar, Linxi Fan, Yuke Zhu

数据操作感知基础模型生成模型机器人学习

这是一篇把 sim-to-real 从“精确转移问题”改写为“语义对齐的数据混合问题”的论文:它的核心贡献不是更逼真的仿真,而是证明并系统化了仿真数据在真实机器人操作联合训练中的有效条件与边界。

CordViP: Correspondence-based Visuomotor Policy for Dexterous Manipulation in Real-World figure
RSS2025Paper 110

CordViP: Correspondence-based Visuomotor Policy for Dexterous Manipulation in Real-World

Yankai Fu, Ning Chen, Qiuxuan Feng, Zichen Zhou, Mengzhen Liu, Mingdong Wu, Tianxing Chen, Shanyu Rong, Jiaming Liu, Hao Dong, Shanghang Zhang

机器人学习灵巧手感知操作模仿学习SLAM/定位

CordViP 属于“以对象-手对应为中心的灵巧操作表示学习”路线:它不是单纯增强 3D 感知,而是把接触和几何对应显式化,从而让真实世界 dexterous manipulation 更稳、更可泛化。

Distilling Contact Planning for Fast Trajectory Optimization in Robot Air Hockey figure
RSS2025Paper 115

Distilling Contact Planning for Fast Trajectory Optimization in Robot Air Hockey

Julius Jankowski, Ante Marić, Puze Liu, Davide Tateo, Jan Peters, Sylvain Calinon

规划控制机器人学习安全导航

这是一个把接触规划做成“可蒸馏的随机最优控制”,再用在线 MPC 执行的混合方法;它的本质贡献是用结构化接触建模和低维决策分解,把原本难以实时求解的动态击打问题压缩成可部署的高层接触选择。

Leveling the Playing Field: Carefully Comparing Classical and Learned Controllers for Quadrotor Trajectory Tracking figure
RSS2025Paper 116

Leveling the Playing Field: Carefully Comparing Classical and Learned Controllers for Quadrotor Trajectory Tracking

Pratik Kunapuli, Jake Welde, Dinesh Jayaraman, Vijay Kumar

控制强化学习机器人学习自动驾驶数据触觉

这是一篇把 quadrotor learned-vs-classical control 的“性能之争”重新还原为“信息边界与评测协议之争”的论文:它的主要贡献不是新控制器,而是证明很多 RL 优势其实来自不对称 benchmark。

Provably-Safe, Online System Identification figure
RSS2025Paper 121

Provably-Safe, Online System Identification

Bohao Zhang, Zichang Zhou, Ram Vasudevan

机器人学习安全操作规划控制

这篇论文把未知负载辨识从“先冒险采数据再拟合”改造成“在可证安全的探索轨道上持续收紧参数集合”的闭环方法,属于安全主动辨识而非传统系统辨识的增量优化。

Human2LocoMan: Learning Versatile Quadrupedal Manipulation with Human Pretraining figure
RSS2025Paper 122

Human2LocoMan: Learning Versatile Quadrupedal Manipulation with Human Pretraining

Yaru Niu, Yunzhe Zhang, Mingyang Yu, Changyi Lin, Chenhao Li, Yikai Wang, Yuxiang Yang, Wenhao Yu, Tingnan Zhang, Zhenzhen Li, Jonathan Francis, Bingqing Chen, Jie Tan, Ding Zhao

Carnegie Mellon University;Google DeepMind

机器人学习数据腿足机器人操作模仿学习人机交互

这是一个把人类演示变成四足操作预训练信号的跨实体模仿学习工作,其真正贡献在于用模态级对齐和模块化共享表示,把原本难以迁移的人-机差异压缩成可学习的接口问题。

SATA: Safe and Adaptive Torque-Based Locomotion Policies Inspired by Animal Learning figure
RSS2025Paper 124

SATA: Safe and Adaptive Torque-Based Locomotion Policies Inspired by Animal Learning

Li Peizhuo, Hongyi Li, Ge Sun, Jin Cheng, Xinrong Yang, Guillaume Bellegarda, Milad Shafiee Ashtiani, Yuhong Cao, Auke Ijspeert, Guillaume Adrien Sartoretti

安全控制腿足机器人机器人学习仿真到现实人机交互

SATA 的本质是把腿足 locomotion 从“姿态跟踪+后端补偿”推进到“直接力矩交互+动物式探索先验”的路线,用更强的物理归纳偏置去换取安全、顺应和零样本迁移。

Bridging the Sim-to-Real Gap for Athletic Loco-Manipulation figure
RSS2025Paper 125

Bridging the Sim-to-Real Gap for Athletic Loco-Manipulation

Nolan Fey, Gabriel B. Margolis, Martin Peticco, Pulkit Agrawal

机器人学习强化学习操作移动操作仿真到现实数据

这篇论文提出了一条面向高动态机器人操作的 sim-to-real 路线:先用无 torque 标签的 residual actuator model 校准复杂致动器,再用 reference-hint curriculum 让 whole-body policy 从可跟踪的运动先验中偏移到任务最优解。

SafeMimic: Towards Safe and Autonomous Human-to-Robot Imitation for Mobile Manipulation figure
RSS2025Paper 128

SafeMimic: Towards Safe and Autonomous Human-to-Robot Imitation for Mobile Manipulation

Arpit Bahety, Arnav Balaji, Ben Abbatematteo, Roberto Martín-Martín

机器人学习安全操作移动操作模仿学习灵巧手

SafeMimic 代表的是一种“从单次人类视频抽取任务骨架,再用安全约束搜索完成机器人适配”的方法谱系,它的真正贡献是把视频模仿、风险过滤和失败回溯整合成了可在真实 mobile manipulation 中运行的自主学习闭环。

Flying Hand: End-Effector-Centric Framework for Versatile Aerial Manipulation Teleoperation and Policy Learning figure
RSS2025Paper 130

Flying Hand: End-Effector-Centric Framework for Versatile Aerial Manipulation Teleoperation and Policy Learning

Guanqi He, Xiaofeng Guo, Luyi Tang, Yuanhang Zhang, Mohammadreza Mousaei, Jiahe Xu, Junyi Geng, Sebastian Scherer, Guanya Shi

操作控制灵巧手人机交互机器人学习模仿学习

这是一篇把 aerial manipulation 从“任务专用系统集合”推进到“末端执行器中心的通用操作框架”的工作,核心贡献是接口与分层抽象,而不是单点控制性能。

Tactile sensing enables vertical obstacle negotiation for elongate many-legged robots figure
RSS2025Paper 133

Tactile sensing enables vertical obstacle negotiation for elongate many-legged robots

Juntao He, Baxi Chong, Massimiliano Iaschi, Vincent R. Nienhusser, Sehoon Ha, Daniel Goldman

机器人学习腿足机器人触觉控制导航感知

这是把 many-legged 机器人的垂直越障从视觉全局规划,转成触觉驱动的局部闭环 skill 的一篇工作,本质贡献是利用形态冗余与低带宽触觉建立了更适合该平台的爬障 inductive bias。

Boxi: Design Decisions in the Context of Algorithmic Performance for Robotics figure
RSS2025Paper 134

Boxi: Design Decisions in the Context of Algorithmic Performance for Robotics

Jonas Frey, Turcan Tuna, Lanke Frank Tarimo Fu, Cedric Weibel, Katharine Patterson, Benjamin Krummenacher, Matthias Müller, Julian Nubert, Maurice Fallon, Cesar Cadena, Marco Hutter

机器人学习操作腿足机器人SLAM/定位

这是一篇把机器人感知平台设计从“隐性工程经验”提升为“影响状态估计上限的研究问题”的系统论文,核心贡献在于证明并沉淀了传感器模态、同步和标定对算法性能的决定性作用。

Dynamic Safety in Complex Environments: Synthesizing Safety Filters with Poisson’s Equation figure
RSS2025Paper 137

Dynamic Safety in Complex Environments: Synthesizing Safety Filters with Poisson’s Equation

Gilbert Bahati, Ryan M. Bena, Aaron Ames

机器人学习安全腿足机器人控制模仿学习数据

这是把动态环境中的 safe set synthesis 从启发式势场/距离场,推进到“由 Poisson 椭圆方程生成、可直接接入 CBF 的安全函数”这一类方法的工作,核心贡献是结构化 inductive bias 和可部署的 perception-to-safety 接口。

Meta-Learning Online Dynamics Model Adaptation in Off-Road Autonomous Driving figure
RSS2025Paper 139

Meta-Learning Online Dynamics Model Adaptation in Off-Road Autonomous Driving

Jacob Levy, Jason Gibson, Bogdan Vlahov, Erica Tevere, Evangelos Theodorou, David Fridovich-Keil, Patrick Spieler

控制自动驾驶安全数据人机交互视觉语言模型

这篇工作属于“把越野场景下的在线动力学学习,从高维重训练改写为 meta-learned 低维子空间滤波”的方法演化,核心贡献是把可部署的自适应控制做成了一个更合理的结构化识别问题。

Enhancing Autonomous Driving Systems with On-Board Deployed Large Language Models figure
RSS2025Paper 140

Enhancing Autonomous Driving Systems with On-Board Deployed Large Language Models

Nicolas Baumann, Cheng Hu, Paviththiren Sivasothilingam, Haotong Qin, Lei Xie, Michele Magno, Luca Benini

机器人学习视觉语言模型自动驾驶控制规划安全

这篇论文代表的是“LLM 作为本地、受约束的语义控制中间层”这一条路线:它真正贡献的是把自然语言意图、安全 MPC 和边缘部署组织成一个可运行接口,而不是提出了一种新的自动驾驶决策范式。

RAPID: Robust and Agile Planner Using Inverse Reinforcement Learning for Vision-Based Drone Navigation figure
RSS2025Paper 142

RAPID: Robust and Agile Planner Using Inverse Reinforcement Learning for Vision-Based Drone Navigation

Minwoo Kim, Geunsik Bae, Jinwoo Lee, Woojae Shin, Changseung Kim, Myongyol Choi, Heejung Shin, Hyongdong Oh

强化学习感知导航规划触觉数据

RAPID 不是简单把 BC 换成 IRL,而是用带特权地图的规划专家重构视觉导航的监督形式,把高速无人机局部规划从动作拟合推进到奖励恢复驱动的策略学习。

Neural Inertial Odometry from Lie Events figure
RSS2025Paper 143

Neural Inertial Odometry from Lie Events

Royina Karegoudra Jayanth, Yinshuang Xu, Evangelos Chatzipantazis, Kostas Daniilidis, Daniel Gehrig

SLAM/定位操作数据感知

这篇论文把 IMU 里的 neural displacement prior 从“学习原始等频序列到位移”推进到“先在 SE(3) 预积分上做 Lie event canonicalization,再让现成 prior 学更稳的变化表示”,核心贡献是输入层的不变性重构,而不是更强的下游推理模型。

Uncertainty-Aware Trajectory Prediction via Rule-Regularized Heteroscedastic Deep Classification figure
RSS2025Paper 144

Uncertainty-Aware Trajectory Prediction via Rule-Regularized Heteroscedastic Deep Classification

Kumar Manas, Christian Schlauch, Adrian Paschke, Christian Wirth, Nadja Klein

数据机器人学习自动驾驶安全操作视觉语言模型

这是一篇把轨迹预测从“纯数据拟合”推进到“规则先验约束下的校准型概率分类”的工作,核心贡献是用 LLM 规模化注入交通规则,再用 heteroscedastic SNGP 让多模态预测在低数据和 OOD 场景里更可信。

Novel Demonstration Generation with Gaussian Splatting Enables Robust One-Shot Manipulation figure
RSS2025Paper 146

Novel Demonstration Generation with Gaussian Splatting Enables Robust One-Shot Manipulation

Sizhe Yang, Wenye Yu, Jia Zeng, Jun Lv, Kerui Ren, Cewu Lu, Dahua Lin, Jiangmiao Pang

机器人学习感知数据模仿学习操作生成模型

这篇工作把机器人示范增强从 2D 图像编辑推进到 3DGS 驱动的空间一致性示范生成,本质上是在用更强的 3D inductive bias 和更好的标签传播来替代昂贵的真实采集与脆弱的 sim2real。

STDArm: Transfer Visuomotor Policy From Static Data Training to Dynamic Robot Manipulation figure
RSS2025Paper 147

STDArm: Transfer Visuomotor Policy From Static Data Training to Dynamic Robot Manipulation

Yifan Duan, Heng Li, Yilong Wu, Wenhao Yu, Xinran Zhang, Yedong Shen, Jianmin Ji, Yanyong Zhang

机器人学习操作数据移动操作腿足机器人控制

STDArm 代表的是一种执行层迁移路线:不重做动态策略学习,而是用高频控制、运动预测和时延校准,把静态训练的 visuomotor policy 变成能在移动平台上实时工作的系统。

PartInstruct: Part-level Instruction Following for Fine-grained Robot Manipulation figure
RSS2025Paper 148

PartInstruct: Part-level Instruction Following for Fine-grained Robot Manipulation

Yifan Yin, Zhengtao Han, Shivam Aarya, Shuhang Xu, Jianxin Wang, Jiawei Peng, Angtian Wang, Alan Yuille, Tianmin Shu

操作感知数据模仿学习基础模型机器人学习

PartInstruct 的本质贡献,是把机器人细粒度操作从“语言到动作”的粗粒度跟随,推进到“语言到部件到 3D 子目标再到动作”的结构化学习,并用数据和评测把这条链条钉住了。

You Only Teach Once: Learn One-Shot Bimanual Robotic Manipulation from Video Demonstrations figure
RSS2025Paper 149

You Only Teach Once: Learn One-Shot Bimanual Robotic Manipulation from Video Demonstrations

Huayi Zhou, Ruixiang Wang, Yunxin Tai, Yueci Deng, Guiliang Liu, Kui Jia

机器人学习灵巧手操作模仿学习人机交互扩散策略

这篇论文把双臂操作从“靠大量机器人示教学连续控制”改写成“从一次人类视频中提取协作骨架,再通过结构化扩增训练任务专用策略”,其核心贡献更像数据与表示的重参数化,而不是单纯的新策略网络。

Manual2Skill: Learning to Read Manuals and Acquire Robotic Skills for Furniture Assembly Using Vision-Language Models figure
RSS2025Paper 150

Manual2Skill: Learning to Read Manuals and Acquire Robotic Skills for Furniture Assembly Using Vision-Language Models

Chenrui Tie, Shengxiang Sun, Jinxuan Zhu, Yiwei Liu, Jingxiang Guo, Yue Hu, Haonan Chen, Junting Chen, Ruihai Wu, Lin Shao

操作视觉语言模型感知机器人学习导航SLAM/定位

这是把手册理解改写成“结构图生成 + 几何落地 + 规划执行”的家具装配系统,核心价值在于强 inductive bias,而不是端到端智能。

RoboMIND: Benchmark on Multi-embodiment Intelligence Normative Data for Robot Manipulation figure
RSS2025Paper 152

RoboMIND: Benchmark on Multi-embodiment Intelligence Normative Data for Robot Manipulation

Kun Wu, Chengkai Hou, Jiaming Liu, Zhengping Che, Xiaozhu Ju, Zhuqin Yang, Meng Li, Yinuo Zhao, Zhiyuan Xu, Guang Yang, Shichao Fan, Xinhua Wang, Fei Liao, Zhen Zhao, Guangyu Li, Zhao Jin, Lecheng Wang, Jilei Mao, Ning Liu, Pei Ren, Qiang Zhang, Yaoxu Lyu, Mengzhen Liu, He Jingyang, Yulin Luo, Zeyu Gao, Chenxuan Li, Chenyang Gu, Yankai Fu, Di Wu, Xingyu Wang, Sixiang Chen, Zhenyu Wang, Pengju An, Siyuan Qian, Shanghang Zhang, Jian Tang

机器人学习数据操作模仿学习视觉语言模型灵巧手

RoboMIND 不是在提出新的操控算法,而是在用统一采集规范和多 embodiment 高覆盖数据,把 robot manipulation 从“零散数据驱动的局部模仿”推进到“可规模化训练通用策略”的基础设施阶段。

ArticuBot: Learning Universal Articulated Object Manipulation Policy via Large Scale Simulation figure
RSS2025Paper 156

ArticuBot: Learning Universal Articulated Object Manipulation Policy via Large Scale Simulation

Yufei Wang, Ziyu Wang, Mino Nakura, Pratik Bhowal, Chia-Liang Kuo, Yi-Ting Chen, Zackory Erickson, David Held

模仿学习操作感知机器人学习导航灵巧手

ArticuBot 不是在发明新的 articulated manipulation 理论,而是在用大规模仿真蒸馏和几何锚定的层级表示,把“开门”这类局部接触任务推到更强的跨对象、跨本体 zero-shot 泛化边界。

SKIL: Semantic Keypoint Imitation Learning for Generalizable Data-efficient Manipulation figure
RSS2025Paper 161

SKIL: Semantic Keypoint Imitation Learning for Generalizable Data-efficient Manipulation

Shengjie Wang, Jiacheng You, Yihang Hu, Jiongye Li, Yang Gao

模仿学习数据操作感知机器人学习基础模型

SKIL 的位置是:用视觉基础模型把模仿学习从像素级端到端控制,改造成语义关键点驱动的稀疏条件生成,从而在少样本真实操作里换来更强的泛化与数据效率,但其上限仍受制于关键点表征能否完整覆盖任务状态。

Learning Interpretable Features from Interventions figure
RSS2025Paper 163

Learning Interpretable Features from Interventions

Erin Hedlund-Botti, Julianna Schalkwyk, Nina Marie Moorman, Chuxuan Yang, Lakshmi Seelam, Sanne Van Waveren, Russell Perkins, Paul Robinette, Matthew Craig Gombolay

机器人学习可解释性操作模仿学习

这篇工作把个性化 LfD 从“学会模仿用户示范”推进到“从用户干预中提取可解释失败语义并据此分流纠错”,本质上是一次面向偏好对齐的局部化、语义化 intervention learning。