Robotics: Science and Systems · Offline Paper Notes

RSS2025 论文全集

来源：https://roboticsconference.org/program/papers/。本资料库按 RSS 2025 归档。共 163 篇论文，PDF、文本、代表图和分析缓存均保存在本目录。

Learned Perceptive Forward Dynamics Model for Safe and Platform-aware Robotic Navigation figure

RSS2025Paper 001

Learned Perceptive Forward Dynamics Model for Safe and Platform-aware Robotic Navigation

Pascal Roth, Jonas Frey, Cesar Cadena, Marco Hutter

ETH Zurich † NVIDIA ‡ Max Planck Institute for Intelligent Systems

机器人学习安全导航控制感知腿足机器人

论文针对腿足机器人在复杂地形中导航时，传统简化动力学与手工代价函数既难调参又难反映平台能力的问题，提出感知式前向动力学模型：结合周围高度几何与本体感觉历史，预测多步未来状态及失败风险，并嵌入零样本 MPPI，以更简单代价实现平台相关的安全规划。ANYmal 上其位姿预测较基线平均提升 41%，粗糙地形仿真导航成功率提升 27%，并展示了仿真到现实迁移；但增益分解文中未充分说明，判断受限于 PDF 文本抽取质量。

PDF AlphaXiv Code

Demonstrating ViSafe: Vision-enabled Safety for High-speed Detect and Avoid figure

RSS2025Paper 002

Demonstrating ViSafe: Vision-enabled Safety for High-speed Detect and Avoid

Parv Kapoor, Ian Higgins, Nikhil Varma Keetha, Jay Patrikar, Brady Moon, Zelin Ye, Yao He, Ivan Cisneros, Changliu Liu, Eunsuk Kang, Sebastian Scherer

安全感知导航机器人学习自动驾驶触觉

ViSafe 代表的是一条“以感知不确定性为输入、以 CBF 为安全外壳”的 vision-only airborne DAA 路线：它的贡献不在于单个模块更强，而在于把视觉、状态估计和安全控制组织成了一个可部署的闭环。

Self-supervised Multi-future Occupancy Forecasting for Autonomous Driving figure

RSS2025Paper 003

Self-supervised Multi-future Occupancy Forecasting for Autonomous Driving

Bernard Lange, Masha Itkina, Jiachen Li, Mykel Kochenderfer

自动驾驶感知导航安全扩散策略生成模型

这是一篇把自动驾驶 occupancy forecasting 从栅格级确定性外推，推进到连续潜空间中的多模态随机世界模型的工作，核心贡献是更好的表示与更合理的不确定性建模，而不是单纯堆大模型。

MISO: Multiresolution Submap Optimization for Efficient Globally Consistent Neural Implicit Reconstruction figure

RSS2025Paper 004

MISO: Multiresolution Submap Optimization for Efficient Globally Consistent Neural Implicit Reconstruction

Yulun Tian, Hanwen Cao, Sunghwan Kim, Nikolay Atanasov

机器人学习SLAM/定位数据基础模型感知

MISO 把大规模 neural SDF SLAM 从“全场几何优化”改造成“多分辨率 submap 的隐空间分层对齐”，核心贡献是用更合理的优化结构换取可扩展性和全局一致性，而不是单纯堆更强的表示或更大的模型。

Doppler Correspondence: Non-Iterative Scan Matching With Doppler Velocity-Based Correspondence figure

RSS2025Paper 005

Doppler Correspondence: Non-Iterative Scan Matching With Doppler Velocity-Based Correspondence

Jiwoo Kim, Geunsik Bae, Changseung Kim, Jinwoo Lee, Woojae Shin, Hyondong Oh

数据感知SLAM/定位

这是把 4D 传感器的 Doppler 从“辅助信息”提升为“对应关系定义”的工作，属于用物理可观测性重写 scan matching 前端的路线，而不是单纯改进 ICP 的工程优化。

PDF AlphaXiv Code

DRO: Doppler-Aware Direct Radar Odometry with Gyroscope figure

RSS2025Paper 006

DRO: Doppler-Aware Direct Radar Odometry with Gyroscope

Cedric Le Gentil, Leonardo Brizi, Daniil Lisus, Xinyuan Qiao, Giorgio Grisetti, Timothy Barfoot

机器人学习数据SLAM/定位安全强化学习感知

DRO 的位置是：把 spinning radar odometry 从“特征/关联驱动的离散配准”推进到“连续时间、密集强度、gyro/Doppler 物理约束”的直接优化框架，其中真正的进步主要来自建模方式重写，而不是某个单点模块。

Certifiably-Correct Mapping for Safe Navigation Despite Odometry Drift figure

RSS2025Paper 007

Certifiably-Correct Mapping for Safe Navigation Despite Odometry Drift

Devansh R. Agrawal, Rajiv Govindjee, Taekyung Kim, Trushant Adeshara, Jiangbo Yu, Anurekha Ravikumar, Dimitra Panagou

机器人学习SLAM/定位安全导航感知规划

这是把 SLAM/建图从“尽量准确重建世界”推进到“对局部 free space 给出形式化安全证书”的工作，核心贡献是用增量位姿不确定性驱动 safe set 收缩，从而把地图错误从碰撞风险改写成可控的保守遗忘。

Kinodynamic Trajectory Following with STELA: Simultaneous Trajectory Estimation & Local Adaptation figure

RSS2025Paper 008

Kinodynamic Trajectory Following with STELA: Simultaneous Trajectory Estimation & Local Adaptation

Edgar Granados, Sumanth Tangirala, Kostas Bekris

机器人学习控制自动驾驶安全规划

STELA把 kinodynamic trajectory following 从“控制问题”改写成“带时间重参数化的在线因子图推断”，核心贡献是让规划轨迹、状态估计和局部安全修正在同一表示里闭环起来。

PDF AlphaXiv Other

Debiasing 6-DOF IMU via Hierarchical Learning of Continuous Bias Dynamics figure

RSS2025Paper 009

Debiasing 6-DOF IMU via Hierarchical Learning of Continuous Bias Dynamics

Ben Liu, Tzu-Yuan Lin, Wei Zhang, Maani Ghaffari

数据控制感知SLAM/定位可解释性

这是一篇把 IMU 去偏差从“学习一个补偿项”推进到“学习可由 pose 监督反演的连续 bias dynamics”的工作，核心贡献是用连续时间、几何一致的显式建模，绕开了 bias GT 依赖。

π₀: A Vision-Language-Action Flow Model for General Robot Control figure

RSS2025Paper 010

π₀: A Vision-Language-Action Flow Model for General Robot Control

Kevin Black, Noah Brown, Danny Driess, Adnan Esmail, Michael Robert Equi, Chelsea Finn, Niccolo Fusai, Lachy Groom, Karol Hausman, Brian Ichter, Szymon Jakubczak, Tim Jones, Liyiming Ke, Sergey Levine, Adrian Li-Bell, Mohith Mothukuri, Suraj Nair, Karl Pertsch, Lucy Xiaoyang Shi, Laura Smith, James Tanner, Quan Vuong, Anna Walling, Haohuan Wang, Ury Zhilinsky

视觉语言模型基础模型感知灵巧手控制机器人学习

π₀ 代表的是“用预训练 VLM 提供语义先验、再用 flow matching 学连续动作分布”的通用机器人策略路线；它的真正价值更像是把一般机器人控制推进到可扩展的语义条件生成范式，而不是证明了一种全新的规划智能。

SpatialVLA: Exploring Spatial Representations for Visual-Language-Action Models figure

RSS2025Paper 011

SpatialVLA: Exploring Spatial Representations for Visual-Language-Action Models

Delin Qu, Haoming Song, Qizhi Chen, Yuanqi Yao, Xinyi Ye, Jiayuan Gu, Zhigang Wang, Yan Ding, Bin Zhao, Dong Wang, Xuelong Li

视觉语言模型感知基础模型操作机器人学习控制

SpatialVLA 的本质是把 VLA 从“2D 语义驱动的动作生成”改造成“egocentric 3D 对齐的空间模仿系统”，核心贡献在于用空间归纳偏置提升了跨本体、跨场景的操作泛化，而不只是扩大模型或数据。

FAST: Efficient Action Tokenization for Vision-Language-Action Models figure

RSS2025Paper 012

FAST: Efficient Action Tokenization for Vision-Language-Action Models

Karl Pertsch, Kyle Stachowicz, Brian Ichter, Danny Driess, Suraj Nair, Quan Vuong, Oier Mees, Chelsea Finn, Sergey Levine

机器人学习视觉语言模型感知灵巧手数据扩散策略

FAST 是把机器人动作从逐步分桶改造成频域压缩码流的 VLA 前端，它真正推动的是一种“先压缩、后自回归”的动作建模范式，而不是简单的 tokenization 小修小补。

Uni-NaVid: A Video-based Vision-Language-Action Model for Unifying Embodied Navigation Tasks figure

RSS2025Paper 013

Uni-NaVid: A Video-based Vision-Language-Action Model for Unifying Embodied Navigation Tasks

Jiazhao Zhang, Kunyu Wang, Shaoan Wang, Minghan Li, Haoran Liu, Songlin Wei, Zhongyuan Wang, Zhizheng Zhang, He Wang

机器人学习导航视觉语言模型感知数据

Uni-NaVid代表的是一条“用大规模多任务数据和在线记忆压缩，把导航从任务碎片化系统推进到可实时运行的统一VLA policy”的路线，但其增益很可能主要来自数据覆盖、表征共享和工程可部署性，而非某个全新的推理机制。

Learning to Act Anywhere with Task-centric Latent Actions figure

RSS2025Paper 014

Learning to Act Anywhere with Task-centric Latent Actions

Qingwen Bu, Yanting Yang, Jisong Cai, Shenyuan Gao, Guanghui Ren, Maoqing Yao, Ping Luo, Hongyang Li

视觉语言模型数据基础模型机器人学习导航操作

UniVLA 代表的是一条从“依赖动作标注的端到端 VLA”转向“在任务中心 latent action 空间里做跨 embodiment 规划”的路线，其核心贡献是让 web-scale video 真正进入机器人 policy 学习管线。

Unified World Models: Coupling Video and Action Diffusion for Pretraining on Large Robotic Datasets figure

RSS2025Paper 015

Unified World Models: Coupling Video and Action Diffusion for Pretraining on Large Robotic Datasets

Chuning Zhu, Raymond Yu, Siyuan Feng, Benjamin Burchfiel, Paarth Shah, Abhishek Gupta

机器人学习数据扩散策略模仿学习控制生成模型

UWM 的核心贡献是把机器人模仿学习改写成一个可同时吸收动作数据和视频数据的联合扩散世界模型，实质上是在用更强的生成式归纳偏置与数据复用能力，替代纯 BC 对高质量动作标注的依赖。

PDF AlphaXiv Project

CLIP-RT: Learning Language-Conditioned Robotic Policies from Natural Language Supervision figure

RSS2025Paper 016

CLIP-RT: Learning Language-Conditioned Robotic Policies from Natural Language Supervision

Gi-Cheon Kang, Junghyun Kim, Kyuhwan Shim, Jun Ki Lee, Byoung-Tak Zhang

感知数据模仿学习视觉语言模型基础模型机器人学习

CLIP-RT 是一条把机器人学习从低层动作模仿重写为语言语义对齐与可扩展数据采集的路线：核心贡献不在更大模型，而在用自然语言重构监督和动作表示，从而提升新技能学习的可迁移性与采集可扩展性。

Fine-Tuning Vision-Language-Action Models: Optimizing Speed and Success figure

RSS2025Paper 017

Fine-Tuning Vision-Language-Action Models: Optimizing Speed and Success

Moo Jin Kim, Chelsea Finn, Percy Liang

机器人学习视觉语言模型感知灵巧手基础模型模仿学习

这是一篇把 VLA fine-tuning 从“语言式自回归生成”重构为“并行的连续动作块预测”的工作，核心贡献是通过改变输出时序与表示方式，让 pretrained VLM 真正更像可部署的机器人控制器。

PDF AlphaXiv Project

NaVILA: Legged Robot Vision-Language-Action Model for Navigation figure

RSS2025Paper 018

NaVILA: Legged Robot Vision-Language-Action Model for Navigation

An-Chieh Cheng, Yandong Ji, Zhaojing Yang, Zaitian Gongye, Xueyan Zou, Jan Kautz, Erdem Biyik, Hongxu Yin, Sifei Liu, Xiaolong Wang

机器人学习腿足机器人视觉语言模型感知导航强化学习

NaVILA把腿足机器人VLN从“VLM直接学控制”改成“VLM生成语言化中层计划、专用控制器负责执行”的两层范式，核心贡献是用动作表示重构来换取更好的泛化、可迁移性和真实部署鲁棒性。

ConRFT: A Reinforced Fine-tuning Method for VLA Models via Consistency Policy figure

RSS2025Paper 019

ConRFT: A Reinforced Fine-tuning Method for VLA Models via Consistency Policy

Yuhui Chen, Shuai Tian, Shugao Liu, Yingting Zhou, Haoran Li, Dongbin Zhao

机器人学习视觉语言模型触觉模仿学习操作强化学习

ConRFT 是把 VLA 微调从纯监督适配推进到“离线示范 + 价值约束 + 在线受控改进”的 reinforced fine-tuning 路线，核心价值在于用一致性 policy 把真机小样本 RL 变得可行，但其增益是否超越数据覆盖与系统工程仍需更强验证。

PDF AlphaXiv Project

Demonstrating MuJoCo Playground figure

RSS2025Paper 020

Demonstrating MuJoCo Playground

Kevin Zakka, Baruch Tabanpour, Qiayuan Liao, Mustafa Haiderbhai, Samuel Holt, Jing Yuan Luo, Arthur Allshire, Erik Frey, Koushil Sreenath, Lueder Alexander Kahrs, Carmelo Sferrazza, Yuval Tassa, Pieter Abbeel

灵巧手腿足机器人仿真到现实机器人学习

这是一篇把 MuJoCo/MJX、批量渲染和真机控制整合成统一 GPU 原生工作流的系统论文，其核心贡献是显著降低机器人 sim-to-real 的迭代成本，而不是提出新的学习算法。

Demonstrating GPU Parallelized Robot Simulation and Rendering for Generalizable Embodied AI with ManiSkill3 figure

RSS2025Paper 021

Demonstrating GPU Parallelized Robot Simulation and Rendering for Generalizable Embodied AI with ManiSkill3

Stone Tao, Fanbo Xiang, Arth Shukla, Yuzhe Qin, Xander Hinrichsen, Xiaodi Yuan, Chen Bao, Xinsong Lin, Yulin Liu, Tse-Kai Chan, Yuan Gao, Xuanlin Li, Tongzhou Mu, Nan Xiao, Arnav Gurha, Viswesh Nagaswamy Rajesh, Yong Woo Choi, Yen-Ru Chen, Zhiao Huang, Roberto Calandra, Rui Chen, Shan Luo, Hao Su

操作强化学习模仿学习感知机器人学习导航

ManiSkill3 不是一篇“新算法”论文，而是把机器人学习从窄场景、低吞吐的仿真范式推进到可做多任务异构大规模训练的平台级工作，其核心贡献是系统 scaling 与分布扩张，而非新的控制或学习理论。

RoboVerse: A Unified Platform, Benchmark and Dataset for Scalable and Generalizable Robot Learning figure

RSS2025Paper 022

RoboVerse: A Unified Platform, Benchmark and Dataset for Scalable and Generalizable Robot Learning

Haoran Geng, Feishi Wang, Songlin Wei, Yuyang Li, Bangjun Wang, Boshi An, Haozhe Lou, Charlie Tianyue Cheng, Peihao Li, Haozhe Chen, Yutong Liang, Yuxi Qian, Jiageng Mao, Weikang Wan, Yiran Geng, Mingtong Zhang, Jiangran Lyu, Siheng Zhao, Jiazhao Zhang, Chaoyi Xu, Jialiang Zhang, Chengyang Zhao, Haoran Lu, Yufei Ding, Ran Gong, Yuran Wang, Yuxuan Kuang, Ruihai Wu, Baoxiong Jia, Hao Dong, Siyuan Huang, Yue Wang, Jitendra Malik, Pieter Abbeel

数据机器人学习强化学习模仿学习触觉导航

RoboVerse 不是提出新 policy 的论文，而是用统一仿真接口 + 大规模合成数据 + 标准化 benchmark，把机器人学习从碎片化实验推进到可规模化、可复用、可比较的基础设施路线。

Robot Data Curation with Mutual Information Estimators figure

RSS2025Paper 023

Robot Data Curation with Mutual Information Estimators

Joey Hejna, Suvir Mirchandani, Ashwin Balakrishna, Annie Xie, Ayzaan Wahid, Jonathan Tompson, Pannag R. Sanketi, Dhruv Shah, Coline Manon Devin, Dorsa Sadigh

机器人学习数据模仿学习感知灵巧手

这篇论文把机器人演示数据筛选从“看起来像专家”推进到“对 state-action 互信息的贡献有多大”，本质上是一个面向小数据机器人场景的统计型 curation 方法，而非新的模仿学习范式。

Coherence-based Approximate Derivatives via Web of Affine Spaces Optimization figure

RSS2025Paper 024

Coherence-based Approximate Derivatives via Web of Affine Spaces Optimization

Daniel Rakita, Chen Liang, Qian Wang

机器人学习感知

WASP 把连续场景中的导数计算从“每次从头重算”改成“利用历史仿射几何做增量修正”，本质上是一种面向序列 coherence 的导数复用框架，而不是单点求导的新算法。

Robot Learning with Super-Linear Scaling figure

RSS2025Paper 025

Robot Learning with Super-Linear Scaling

Marcel Torne Villasevil, Arhan Jain, Jiayi Yuan, Vidyaaranya Macha, Lars Lien Ankile, Anthony Simeonov, Pulkit Agrawal, Abhishek Gupta

数据机器人学习基础模型模仿学习操作强化学习

这篇工作把机器人学习从“人类提供数据、模型去拟合”推进到“模型逐步接管数据生成”的自举式范式，真正贡献是一个面向真实场景的、以扫描和蒸馏驱动的可摊薄人力成本的数据飞轮。

Action Flow Matching for Lifelong Learning figure

RSS2025Paper 026

Action Flow Matching for Lifelong Learning

Alejandro Murillo-González, Lantao Liu

控制安全数据机器人学习自动驾驶灵巧手

AFM 把 continual robot learning 从“在失配动力学上继续探索并修模型”改写成“先用 flow matching 校正动作意图，再用更有信息的数据反向对齐模型”，属于动作层数据重分布而非纯参数更新的一类方法。

Solving Multi-Agent Safe Optimal Control with Distributed Epigraph Form MARL figure

RSS2025Paper 027

Solving Multi-Agent Safe Optimal Control with Distributed Epigraph Form MARL

Songyuan Zhang, Oswin So, Mitchell Black, Zachary Serlin, Chuchu Fan

机器人学习安全强化学习多机器人控制触觉

这是把 multi-agent hard safety 的核心难题从“调权衡”改成“找可行上界并可分解执行”的一类结构化 safe MARL 方法，核心贡献在于 epigraph 重写与分布式可解性证明，而不是新的策略学习模块。

RLDG: Robotic Generalist Policy Distillation via Reinforcement Learning figure

RSS2025Paper 028

RLDG: Robotic Generalist Policy Distillation via Reinforcement Learning

Charles Xu, Qiyang Li, Jianlan Luo, Sergey Levine

机器人学习基础模型强化学习触觉操作数据

RLDG 本质上是把 RL 从“直接优化 policy”的角色改成“为 generalist 生成高质量监督数据”的角色，用任务专用专家重塑 foundation model 的动作先验，从而在精密操作上获得更强执行力而不牺牲通用性。

PDF AlphaXiv Project

ROMAN: Open-Set Object Map Alignment for Robust View-Invariant Global Localization figure

RSS2025Paper 029

ROMAN: Open-Set Object Map Alignment for Robust View-Invariant Global Localization

Mason Peterson, Yixuan Jia, Yulun Tian, Annika Thomas, Jonathan P. How

机器人学习SLAM/定位数据导航基础模型感知

ROMAN 是把全球定位从“图像/特征匹配”推进到“开放词表对象子图的一致性对齐”的一类方法代表，其真正贡献是用语义、形状和重力先验重写了高歧义场景下的数据关联机制。

PDF AlphaXiv Code

GauSS-MI: Gaussian Splatting Shannon Mutual Information for Active 3D Reconstruction figure

RSS2025Paper 030

GauSS-MI: Gaussian Splatting Shannon Mutual Information for Active 3D Reconstruction

Yuhan Xie, Yixi Cai, Yinqiang Zhang, Lei Yang, Jia Pan

感知规划

这是一篇把 active 3D reconstruction 从“探索未知空间”推进到“主动压缩渲染不确定性”的工作，本质贡献是用 3DGS 上的可计算视觉 mutual information 重写了 next-best-view 的目标函数。

LiDAR Registration with Visual Foundation Models figure

RSS2025Paper 031

LiDAR Registration with Visual Foundation Models

Niclas Vödisch, Giovanni Cioffi, Marco Cannici, Wolfram Burgard, Davide Scaramuzza

感知基础模型机器人学习灵巧手数据SLAM/定位

这篇论文把长期LiDAR配准从“学习3D几何描述子”改写为“用DINOv2视觉表征做点匹配，再交给传统几何求解”，核心贡献是证明视觉基础模型能显著抬高长期注册中的对应质量与泛化上限。

PDF AlphaXiv Code

Building Rome with Convex Optimization figure

RSS2025Paper 032

Building Rome with Convex Optimization

Haoyu Han, Heng Yang

感知

这篇论文属于“用 learned 3D 先验重写经典 BA，再借助 SDP/BM 做全局可扩展求解”的路线，真正贡献是把原本依赖初始化的非凸几何估计问题改造成了一个更容易被全局优化处理的 lifted optimization problem。

Demonstrating MOSART: Opening Articulated Structures in the Real World figure

RSS2025Paper 033

Demonstrating MOSART: Opening Articulated Structures in the Real World

Arjun Gupta, Michelle Zhang, Rishik Sathua, Saurabh Gupta

机器人学习操作移动操作模仿学习基础模型数据

这是一篇把 articulated object opening 当作真实世界 mobile manipulation 试金石的系统论文：它用模块化几何先验证明了，在当前数据与视角条件下，结构化系统比端到端学习更接近可部署的泛化。

Vysics: Object Reconstruction Under Occlusion by Fusing Vision and Contact-Rich Physics figure

RSS2025Paper 034

Vysics: Object Reconstruction Under Occlusion by Fusing Vision and Contact-Rich Physics

Bibit Bianchini, Minghan Zhu, Mengti Sun, Bowen Jiang, Camillo Jose Taylor, Michael Posa

机器人学习感知控制触觉操作SLAM/定位

Vysics 把遮挡下的对象重建从纯视觉补全，推进为“用接触动力学反推隐藏几何”的机器人建模框架，其主要贡献是一个更适合 manipulation 场景的几何-物理统一 inductive bias，而不是单纯的模块堆叠。

PDF AlphaXiv Project

Implicit Neural-Representation Learning for Elastic Deformable-Object Manipulations figure

RSS2025Paper 035

Implicit Neural-Representation Learning for Elastic Deformable-Object Manipulations

Jeongho Ha, Minseok Song, Bonggyeong Park, Daehyung Park

操作强化学习机器人学习感知触觉

这是一篇把弹性物体操作从“直接学控制”转成“先学可补全的隐式几何状态、再用 RL 对齐任务”的方法论文，本质贡献是为部分可见软体操作提供了更强的状态归纳偏置，而非提出了新的控制范式。

PDF AlphaXiv Project

Particle-Grid Neural Dynamics for Learning Deformable Object Models from RGB-D Videos figure

RSS2025Paper 036

Particle-Grid Neural Dynamics for Learning Deformable Object Models from RGB-D Videos

Kaifeng Zhang, Baoyu Li, Kris Hauser, Yunzhu Li

控制感知机器人学习操作人机交互规划

这篇论文把 deformable object learning 从脆弱的稀疏图消息传递，推进到更接近 MPM 的粒子-网格连续场建模，是一次以表示重构为核心、面向真实部分观测数据的动力学学习改造。

PDF AlphaXiv Project

V-HOP: Visuo-Haptic 6D Object Pose Tracking figure

RSS2025Paper 037

V-HOP: Visuo-Haptic 6D Object Pose Tracking

Hongyu Li, Mingxi Jia, Mete Tuluhan Akbulut, Yu Xiang, George Konidaris, Srinath Sridhar

触觉感知灵巧手数据操作仿真到现实

V-HOP 的位置不是“又一个 vision+tactile 融合模型”，而是把多模态 6D tracking 推向“跨 embodiment 表征对齐 + 时序状态估计”的路线，真正解决真实操作里传感器异构和单帧不稳定这两个根瓶颈。

PDF AlphaXiv Project

Joint State and Noise Covariance Estimation figure

RSS2025Paper 038

Joint State and Noise Covariance Estimation

Kasra Khosoussi, Iman Shames

机器人学习感知SLAM/定位

这是一篇把 SLAM/视觉中的噪声协方差从手工超参数提升为可解析在线估计变量的论文，核心贡献是用约束 ML/MAP 让“状态—权重”联合优化变成可落地、可接现有求解器的统计更新框架。

Map Space Belief Prediction for Manipulation-Enhanced Mapping figure

RSS2025Paper 039

Map Space Belief Prediction for Manipulation-Enhanced Mapping

Joao Marcos Correia Marques, Nils Dengler, Jesper Mücke, Tobias Zaenker, Shenlong Wang, Maren Bennewitz, Kris Hauser

机器人学习操作SLAM/定位规划

这是一篇把机械搜索式的“看/动”决策重写成 calibrated map-belief propagation 的工作，本质贡献是用空间化世界模型把主动感知、操作后果预测和信息增益规划统一起来，而不是单纯做更强的视点选择。

PINGS: Gaussian Splatting Meets Distance Fields within a Point-Based Implicit Neural Map figure

RSS2025Paper 040

PINGS: Gaussian Splatting Meets Distance Fields within a Point-Based Implicit Neural Map

Yue Pan, Xingguang Zhong, Liren Jin, Louis Wiesmann, Marija Popovic, Jens Behley, Cyrill Stachniss

机器人学习SLAM/定位数据基础模型感知

PINGS 把 3DGS 从“独立的外观表示”改造成受 SDF 约束的 surface-aware rendering 分支，并通过共享 point-based latent map 让几何与外观在大规模 SLAM 中真正互相纠偏。

RAMEN: Real-time Asynchronous Multi-agent Neural Implicit Mapping figure

RSS2025Paper 041

RAMEN: Real-time Asynchronous Multi-agent Neural Implicit Mapping

Hongrui Zhao, Boris Ivanovic, Negar Mehr

机器人学习多机器人SLAM/定位数据

RAMEN 本质上是把多机器人神经隐式建图从“必须同步的参数平均”推进到“面向异步通信的可靠性加权共识”，解决的是分布式优化在真实网络条件下的失稳问题，而不是单纯提升表示能力。

PDF AlphaXiv Code

RoboPanoptes: The All-Seeing Robot with Whole-body Dexterity figure

RSS2025Paper 042

RoboPanoptes: The All-Seeing Robot with Whole-body Dexterity

Xiaomeng Xu, Dominik Bauer, Shuran Song

机器人学习灵巧手感知操作模仿学习

这篇论文把“全身可动”变成“全身可见”，用分布式视觉把高自由度机器人从末端执行器范式推进到 body-centric 的全身操作范式。

PDF AlphaXiv Project

Bilevel Learning for Bilevel Planning figure

RSS2025Paper 043

Bilevel Learning for Bilevel Planning

Bowen Li, Tom Silver, Sebastian Scherer, Alexander G. Gray

机器人学习规划操作模仿学习灵巧手移动操作

这是把 bilevel planning 从“手工抽象上做规划”推进到“抽象本身也要被学习并受规划反向约束”的工作，核心贡献是为机器人组合泛化提供了一个更可扩展的神经-符号闭环。

PDF AlphaXiv Project

A Biconvex Method for Minimum-Time Motion Planning Through Sequences of Convex Sets figure

RSS2025Paper 044

A Biconvex Method for Minimum-Time Motion Planning Through Sequences of Convex Sets

Tobia Marcucci, Mathew Halm, William Yang, Dongchan Lee, Andrew Marchese

规划导航安全

这是一种把最短时间走廊规划改写成‘切换点/切换速度’双坐标上的可行凸交替优化的方法，核心贡献是用结构化 convex restriction 同时换来可行性、稳定性和接近工业可用的速度。

Superfast Configuration-Space Convex Set Computation on GPUs for Online Motion Planning figure

RSS2025Paper 045

Superfast Configuration-Space Convex Set Computation on GPUs for Online Motion Planning

Peter Werner, Richard Cheng, Tom Stewart, Russ Tedrake, Daniela Rus

机器人学习安全规划导航操作感知

它把高维动态运动规划从“直接解非凸碰撞优化”推进到“先用 GPU 在线构造路径周围的概率安全凸管道，再在凸域上做稳定优化”的路线。

PDF AlphaXiv Project

Global Contact-Rich Planning with Sparsity-Rich Semidefinite Relaxations figure

RSS2025Paper 046

Global Contact-Rich Planning with Sparsity-Rich Semidefinite Relaxations

Shucheng Kang, Guorui Liu, Heng Yang

机器人学习规划导航灵巧手

这篇论文把 contact-rich planning 从“难以全局求解的非凸轨迹优化”推进到“可利用机器人特定稀疏结构进行高阶凸松弛的 POP 问题”，核心贡献是结构化全局优化，而不是单纯的求解器改良。

On the Surprising Robustness of Sequential Convex Optimization for Contact-Implicit Motion Planning figure

RSS2025Paper 047

On the Surprising Robustness of Sequential Convex Optimization for Contact-Implicit Motion Planning

Yulin Li, Haoyu Han, Shucheng Kang, Jun Ma, Heng Yang

规划导航安全

CRISP 不是在“更好地解 MPCC”，而是在 contact-implicit planning 上用 primal-only 的 sequential convex optimization 取代 KKT 驱动的求解逻辑，从而把原本病态的接触规划变成一个可从极差初值稳定推进的数值过程。

Effective Sampling for Robot Motion Planning Through the Lens of Lattices figure

RSS2025Paper 048

Effective Sampling for Robot Motion Planning Through the Lens of Lattices

Itai Panasoff, Kiril Solovey

机器人学习规划导航

这篇论文用 lattice 的最优覆盖性质重写了 sampling-based motion planning 的 finite-time 采样设计，把“随机采样的渐近保证”推进到“可构造、可比较、且更高效的确定性覆盖”。

PDF AlphaXiv Code

Efficient Hierarchical Any-Angle Path Planning on Multi-Resolution 3D Grids figure

RSS2025Paper 049

Efficient Hierarchical Any-Angle Path Planning on Multi-Resolution 3D Grids

Victor Reijgwart, Cesar Cadena, Roland Siegwart, Lionel Ott

机器人学习规划导航感知基础模型数据

这是一篇把 Theta* 的 any-angle 几何最优性与 octree 的层级压缩真正融合起来的规划工作：核心贡献是用区域级 predecessor 传播和按歧义细化，把 3D Euclidean 全局规划从“高分辨率图搜索”变成“稀疏结构上的递归最短路”。

Differentiable GPU-Parallelized Task and Motion Planning figure

RSS2025Paper 050

Differentiable GPU-Parallelized Task and Motion Planning

William Shen, Caelan Reed Garrett, Nishanth Kumar, Ankit Goyal, Tucker Hermans, Leslie Pack Kaelbling, Tomás Lozano-Pérez, Fabio Ramos

机器人学习规划导航安全操作灵巧手

cuTAMP 不是在 TAMP 里提出一种更强的单次求解器，而是把离散骨架搜索和连续约束求解重构为 GPU 上的大规模并行 test-time 搜索，从而用“覆盖多个 basin + 可微精修”替代传统串行采样/优化的脆弱性。

PDF AlphaXiv Project

Flow Matching Ergodic Coverage figure

RSS2025Paper 051

Flow Matching Ergodic Coverage

Max Muchen Sun, Allison Pinosky, Todd Murphey

机器人学习控制生成模型灵巧手

它把 ergodic coverage 从“只能用少数手工 metric 的轨迹优化”升级为“可匹配任意 reference flow 的 LQ flow matching 框架”，本质上是一次把生成模型几何引入控制 synthesis 的接口层创新。

Reactive Diffusion Policy: Slow-Fast Visual-Tactile Policy Learning for Contact-Rich Manipulation figure

RSS2025Paper 052

Reactive Diffusion Policy: Slow-Fast Visual-Tactile Policy Learning for Contact-Rich Manipulation

Han Xue, Jieji Ren, Wendi Chen, Gu Zhang, Fang Yuan, Guoying Gu, Huazhe Xu, Cewu Lu

触觉感知扩散策略操作机器人学习模仿学习

这是一篇把 contact-rich 模仿学习从“开环动作块预测”推进到“慢速轨迹规划 + 高频触觉闭环纠偏”的工作，核心贡献是新的时间尺度分解，而不只是更大模型或更多传感器。

Physics-Driven Data Generation for Contact-Rich Manipulation via Trajectory Optimization figure

RSS2025Paper 053

Physics-Driven Data Generation for Contact-Rich Manipulation via Trajectory Optimization

Lujie Yang, H.j. Terry Suh, Tong Zhao, Bernhard Paus Graesdal, Tarik Kelestemur, Jiuguang Wang, Tao Pang, Russ Tedrake

机器人学习数据操作规划生成模型灵巧手

这是一篇把“人类示范 + 物理约束优化”用作数据生成器的论文：它真正贡献的不是新 policy，而是让少量 demo 通过 trajectory optimization 被放大成跨 embodiment 的可执行接触数据分布。

PDF AlphaXiv Project

ViTaSCOPE: Visuo-tactile Implicit Representation for In-hand Pose and Extrinsic Contact Estimation figure

RSS2025Paper 054

ViTaSCOPE: Visuo-tactile Implicit Representation for In-hand Pose and Extrinsic Contact Estimation

Jayjun Lee, Nima Fazeli

触觉操作灵巧手感知仿真到现实SLAM/定位

ViTaSCOPE把手内位姿估计和外部接触定位统一成对象中心的连续隐式反演问题，核心贡献不是更大模型，而是用SDF+剪切场的表示对齐，把部分视觉/触觉观测转化为可优化、可注册、可迁移的几何解释。

A low-cost and lightweight 6 DoF bimanual arm for dynamic and contact-rich manipulation figure

RSS2025Paper 055

A low-cost and lightweight 6 DoF bimanual arm for dynamic and contact-rich manipulation

Jaehyung Kim, Jiho Kim, Dongryung Lee, Yujin Jang, Beomjoon Kim

机器人学习操作灵巧手强化学习腿足机器人感知

这是一篇把动态操作的核心瓶颈从算法转回硬件、并用低惯量低减速比的可复现双臂平台把“可动态、可回驱、可负担”首次同时落到实验室级别的系统论文。

PDF AlphaXiv Project

PP-Tac: Paper Picking Using Omnidirectional Tactile Feedback in Dexterous Robotic Hands figure

RSS2025Paper 056

PP-Tac: Paper Picking Using Omnidirectional Tactile Feedback in Dexterous Robotic Hands

Pei Lin, Yuzhe Huang, Jianpeng Ma, Chenxi Xiao, Wanlin Li, Ziyuan Jiao

机器人学习灵巧手触觉操作感知控制

PP-Tac 是一条把纸类拾取从视觉驱动抓取改写为触觉闭环接触控制的路线，真正贡献在于用全向触觉把高滑移变形任务变成可在线纠偏的问题，而 diffusion 轨迹学习更像是在这个控制框架上补足动作先验。

GeoDEx: A Unified Geometric Framework for Tactile Dexterous and Extrinsic Manipulation under Force Uncertainty figure

RSS2025Paper 057

GeoDEx: A Unified Geometric Framework for Tactile Dexterous and Extrinsic Manipulation under Force Uncertainty

Sirui Chen, Sergio Francisco Aguilera Marinovic, Soshi Iba, Rana Soltani Zarrin

机器人学习触觉操作灵巧手规划控制

GeoDEx 不是在把触觉做得更准，而是在把不准的触觉重新投影到力学可行域里，从而用更强的物理先验统一了灵巧抓取与外部接触操作。

Demonstrating the Octopi-1.5 Visual-Tactile-Language Model figure

RSS2025Paper 058

Demonstrating the Octopi-1.5 Visual-Tactile-Language Model

Samson Yu, Lin Kelvin, Harold Soh

机器人学习触觉灵巧手感知视觉语言模型模仿学习

Octopi-1.5 代表的是一种把触觉感知、语言常识和检索记忆拼成可教学推理系统的演化路线，但目前更像是强 backbone + memory augmentation 的系统集成，而非触觉理解本身的理论突破。

Demonstrating REASSEMBLE: A Multimodal Dataset for Contact-rich Robotic Assembly and Disassembly figure

RSS2025Paper 059

Demonstrating REASSEMBLE: A Multimodal Dataset for Contact-rich Robotic Assembly and Disassembly

Daniel Sliwowski, Shail Jadav, Sergej Stanovcic, Jędrzej Orbik, Johannes Heidersberger, Dongheui Lee

机器人学习操作数据模仿学习感知触觉

REASSEMBLE 的位置不是提出新算法，而是用标准化真机多模态接触数据把装配/拆卸从“难以学习的长时序控制问题”推进成“可被统一建模的学习问题”。

Robust Peg-in-Hole Assembly under Uncertainties via Compliant and Interactive Contact-Rich Manipulation figure

RSS2025Paper 060

Robust Peg-in-Hole Assembly under Uncertainties via Compliant and Interactive Contact-Rich Manipulation

Yiting Chen, Kenneth Kimble, Howard H. Qian, Podshara Chanrungmaneekul, Robert Seney, Kaiyu Hang

机器人学习操作安全人机交互感知

这是一篇把 peg-in-hole 从“精确规划问题”重写为“通过受控接触逐步收缩不确定性的问题”的论文，核心贡献是用 manipulation funnel 把感知与执行统一成同一种约束吸收机制。

AMO: Adaptive Motion Optimization for Hyper-Dexterous Humanoid Whole-Body Control figure

RSS2025Paper 061

AMO: Adaptive Motion Optimization for Hyper-Dexterous Humanoid Whole-Body Control

Jialong Li, Xuxin Cheng, Tianshu Huang, Shiqi Yang, Ri-Zhao Qiu, Xiaolong Wang

机器人学习腿足机器人灵巧手控制强化学习操作

AMO 的位置是：它不是在 humanoid whole-body control 上再做一个 policy，而是通过重构训练 reference 和命令空间，把“能到哪里、怎么稳地到”这件事从窄步态 imitation 推进到可扩 workspace 的连续泛化控制。

Demonstrating Berkeley Humanoid Lite: An Open-source, Accessible, and Customizable 3D-printed Humanoid Robot figure

RSS2025Paper 062

Demonstrating Berkeley Humanoid Lite: An Open-source, Accessible, and Customizable 3D-printed Humanoid Robot

Yufeng Chi, Qiayuan Liao, Junfeng Long, Xiaoyu Huang, Sophia Shao, Borivoje Nikolic, Zhongyu Li, Koushil Sreenath

机器人学习腿足机器人感知强化学习触觉控制

这是一篇把 humanoid 研究从封闭高门槛硬件，推进到开放、低成本、可复现平台的基础设施型论文，其核心价值是重构研究入口，而不是刷新控制算法本身。

PDF AlphaXiv Video

Learning Getting-Up Policies for Real-World Humanoid Robots figure

RSS2025Paper 063

Learning Getting-Up Policies for Real-World Humanoid Robots

Xialin He, Runpei Dong, Zixuan Chen, Saurabh Gupta

机器人学习腿足机器人安全控制灵巧手强化学习

这篇论文把 humanoid 起身从“直接学控制”改成“先发现恢复轨迹、再蒸馏成可部署策略”的 curriculum 学习问题，证明了在复杂接触场景下，真正有效的提升主要来自任务分解与 inductive bias，而不只是更大规模的 RL。

PDF AlphaXiv Project

Learning Humanoid Standing-up Control across Diverse Postures figure

RSS2025Paper 064

Learning Humanoid Standing-up Control across Diverse Postures

Tao Huang, Junli Ren, Huayi Wang, Zirui Wang, Qingwei Ben, Muning Wen, Xiao Chen, Jianan Li, Jiangmiao Pang

机器人学习控制腿足机器人安全操作移动操作

HoST 代表的是一种把 humanoid 起身从“轨迹执行”改写为“受限姿态泛化 RL”的方法演化：核心贡献是通过分布覆盖和动作约束，让站起策略第一次看起来像能真机落地的恢复控制器，而不是只在仿真里成立的动作模板。

PDF AlphaXiv Project

LangWBC: Language-directed Humanoid Whole-Body Control via End-to-end Learning figure

RSS2025Paper 065

LangWBC: Language-directed Humanoid Whole-Body Control via End-to-end Learning

Yiyang Shao, Bike Zhang, Qiayuan Liao, Xiaoyu Huang, Yuman Gao, Yufeng Chi, Zhongyu Li, Sophia Shao, Koushil Sreenath

机器人学习腿足机器人控制强化学习触觉

LangWBC 本质上是把“文本到动作”的问题从轨迹生成改写成带物理先验的闭环 latent control：它的贡献更像是用 CVAE + RL teacher 重建了一个可被语言索引的 humanoid 动作流形，而不是单纯做了一个更强的 text-to-motion 模型。

ASAP: Aligning Simulation and Real-World Physics for Learning Agile Humanoid Whole-Body Skills figure

RSS2025Paper 066

ASAP: Aligning Simulation and Real-World Physics for Learning Agile Humanoid Whole-Body Skills

Tairan He, Jiawei Gao, Wenli Xiao, Yuanhang Zhang, Zi Wang, Jiashun Wang, Zhengyi Luo, Guanqi He, Nikhil Sobanbabu, Chaoyi Pan, Zeji Yi, Guannan Qu, Kris Kitani, Jessica K. Hodgins, Linxi Fan, Yuke Zhu, Changliu Liu, Guanya Shi

机器人学习控制腿足机器人仿真到现实数据基础模型

ASAP 是一条把 sim-to-real mismatch 重新表述为动作残差对齐问题的 humanoid 控制路线：它的真正贡献在于用真实数据把仿真环境校正到更接近可执行控制，而不是去逼近一个完整、精确的物理世界模型。

A Unified and General Humanoid Whole-Body Controller for Fine-Grained Locomotion figure

RSS2025Paper 067

A Unified and General Humanoid Whole-Body Controller for Fine-Grained Locomotion

Yufei Xue, Wentao Dong, Minghuan Liu, Weinan Zhang, Jiangmiao Pang

机器人学习腿足机器人控制可解释性操作移动操作

HuGWBC 的位置是：把 humanoid whole-body locomotion 从“单一跟踪型控制”推进到“命令空间驱动的可组合控制”，其真正贡献在于用统一命令空间和干预鲁棒训练把多步态、细粒度姿态调节与上半身外部接管整合到同一个可部署策略里。

BeamDojo: Learning Agile Humanoid Locomotion on Sparse Footholds figure

RSS2025Paper 068

BeamDojo: Learning Agile Humanoid Locomotion on Sparse Footholds

Huayi Wang, Zirui Wang, Junli Ren, Qingwei Ben, Tao Huang, Weinan Zhang, Jiangmiao Pang

腿足机器人强化学习操作机器人学习安全感知

BeamDojo 不是把 humanoid sparse foothold locomotion 做成了更大的 RL，而是通过 polygonal-foot reward 重写、双 critic 解耦和两阶段 curriculum，把一个几乎不可学的稀疏接触问题变成了可探索、可部署的策略学习问题。

Gait-Net-augmented Implicit Kino-dynamic MPC for Dynamic Variable-frequency Humanoid Locomotion over Discrete Terrains figure

RSS2025Paper 069

Gait-Net-augmented Implicit Kino-dynamic MPC for Dynamic Variable-frequency Humanoid Locomotion over Discrete Terrains

Junheng Li, Ziwei Duan, Junchao Ma, Quan Nguyen

腿足机器人规划控制安全操作数据

这篇工作属于“learning-augmented sequential MPC”在 humanoid locomotion 上的时间尺度重参数化：它真正贡献的是把步频从难优化变量变成可学习先验，再用局部凸优化恢复接触与运动学可行性。

HOMIE: Humanoid Loco-Manipulation with Isomorphic Exoskeleton Cockpit figure

RSS2025Paper 070

HOMIE: Humanoid Loco-Manipulation with Isomorphic Exoskeleton Cockpit

Qingwei Ben, Feiyu Jia, Jia Zeng, Junting Dong, Dahua Lin, Jiangmiao Pang

控制腿足机器人操作移动操作灵巧手强化学习

HOMIE 不是又一个 humanoid teleop 装置，而是用“RL 接管下半身 + 同构外骨骼直接映射上半身 + 传感手套接管手部”的结构化重分工，把 humanoid loco-manipulation 从高噪声反演问题改造成可高频、低损耗的数据飞轮。

Curating Demonstrations using Online Experience figure

RSS2025Paper 071

Curating Demonstrations using Online Experience

Annie S. Chen, Alec M. Lessing, Yuejiang Liu, Chelsea Finn

机器人学习模仿学习数据操作灵巧手

这篇论文把 demonstration curation 从人工经验和静态损失，推进到基于机器人在线成败反馈的策略可靠性筛选，本质上是在做 embodiment-aware 的数据重写，而不是单纯训练更强的 imitation policy。

CodeDiffuser: Attention-Enhanced Diffusion Policy via VLM-Generated Code for Instruction Ambiguity figure

RSS2025Paper 072

CodeDiffuser: Attention-Enhanced Diffusion Policy via VLM-Generated Code for Instruction Ambiguity

Guang Yin, Yitong Li, Yixuan Wang, Dale Mcconachie, Paarth Shah, Kunimatsu Hashimoto, Huan Zhang, Katherine Liu, Yunzhu Li

机器人学习视觉语言模型操作感知扩散策略可解释性

CodeDiffuser 的定位是：用 VLM 生成可执行代码来显式消解语言歧义，再把语义转成 3D 注意力去约束 diffusion policy，本质上是在机器人操控里用“程序化 grounding”替代黑盒端到端语义-动作耦合。

Can We Detect Failures Without Failure Data? Uncertainty-Aware Runtime Failure Detection for Imitation Learning Policies figure

RSS2025Paper 073

Can We Detect Failures Without Failure Data? Uncertainty-Aware Runtime Failure Detection for Imitation Learning Policies

Chen Xu, Tony Khuong Nguyen, Emma Dixon, Christopher Rodriguez, Patrick Miller, Robert Lee, Paarth Shah, Rares Andrei Ambrus, Haruki Nishimura, Masha Itkina

感知模仿学习数据操作机器人学习安全

这是一篇把机器人 failure detection 从“依赖 failure supervision 的分类问题”重构为“只用成功数据做顺序 OOD 监控”的工作，核心价值在于建模转向与可校准的 runtime 安全预警，而非单纯的 detector engineering。

PDF AlphaXiv Project

Unified Video Action Model figure

RSS2025Paper 074

Unified Video Action Model

Shuang Li, Yihuai Gao, Dorsa Sadigh, Shuran Song

生成模型机器人学习控制扩散策略感知

UVA 的位置是：把视频当作控制表征学习的监督源、把动作当作独立推理目标，用共享 latent + 推理解耦把 video-based policy 从慢而脆的级联生成，推进到一个更实用的统一多模态控制框架。

DexWild: Dexterous Human Interactions for In-the-Wild Robot Policies figure

RSS2025Paper 075

DexWild: Dexterous Human Interactions for In-the-Wild Robot Policies

Tony Tao, Mohan Kumar Srirama, Jason Jingzhou Liu, Kenneth Shaw, Deepak Pathak

机器人学习数据灵巧手人机交互操作模仿学习

DexWild 代表的是一类“用大规模自然人类交互补场景覆盖、用少量机器人数据做执行对齐”的 dexterous manipulation 路线，其核心贡献是数据范式和跨 embodiment 训练组织方式，而不是新的控制算法。

PDF AlphaXiv Project

From Foresight to Forethought: VLM-In-the-Loop Policy Steering via Latent Alignment figure

RSS2025Paper 076

From Foresight to Forethought: VLM-In-the-Loop Policy Steering via Latent Alignment

Yilin Wu, Thomas Tian, Gokul Swamy, Andrea Bajcsy

机器人学习视觉语言模型生成模型操作模仿学习感知

这是一篇把 VLM 从“直接看机器人动作做判断”改造成“先由 latent world model 预测后果、再由 VLM 以语言语义做选择”的 policy steering 工作，本质贡献是用表示对齐来修补生成式机器人控制中的预测-评估鸿沟。

PDF AlphaXiv Project

Is Your Imitation Learning Policy Better than Mine? Policy Comparison with Near-Optimal Stopping figure

RSS2025Paper 077

Is Your Imitation Learning Policy Better than Mine? Policy Comparison with Near-Optimal Stopping

David Snyder, Asher James Hancock, Apurva Badithela, Emma Dixon, Patrick Miller, Rares Andrei Ambrus, Anirudha Majumdar, Masha Itkina, Haruki Nishimura

机器人学习模仿学习操作安全灵巧手数据

这是一篇把机器人 policy comparison 从固定样本的 batch testing 重写为近最优 sequential stopping 的统计方法论文，核心贡献是用更合理的停止机制在小样本、高成本评估中省 trial、保正确性，而不是提出新的学习器。

DDAT: Diffusion Policies Enforcing Dynamically Admissible Robot Trajectories figure

RSS2025Paper 078

DDAT: Diffusion Policies Enforcing Dynamically Admissible Robot Trajectories

Jean-Baptiste Bouvier, Kanghyun Ryu, Qiayuan Liao, Koushil Sreenath, Negar Mehr

机器人学习扩散策略安全生成模型触觉规划

DDAT 把 diffusion policy 从“生成看起来合理的轨迹”推进到“在训练和推理中都被局部动力学可达性约束塑形的轨迹生成器”，其真正贡献是用投影几何重写了扩散轨迹规划的 inductive bias，而不是单纯堆一个约束模块。

PDF AlphaXiv Code

FACTR: Force-Attending Curriculum Training for Contact-Rich Policy Learning figure

RSS2025Paper 079

FACTR: Force-Attending Curriculum Training for Contact-Rich Policy Learning

Jason Jingzhou Liu, Yulong Li, Kenneth Shaw, Tony Tao, Russ Salakhutdinov, Deepak Pathak

触觉机器人学习数据感知人机交互操作

FACTR 不是简单地“把力觉加进机器人”，而是通过课程式削弱视觉捷径，重排多模态训练中的信息主导权，让 contact-rich policy 真正学会依赖 force。

PDF AlphaXiv Code

Morpheus: A Neural-driven Animatronic Face with Hybrid Actuation and Diverse Emotion Control figure

RSS2025Paper 080

Morpheus: A Neural-driven Animatronic Face with Hybrid Actuation and Diverse Emotion Control

Zongzheng Zhang, Jiawen Yang, Ziqiao Peng, Meng Yang, Jianzhu Ma, Lin Cheng, Huazhe Xu, Hang Zhao, Hao Zhao

控制

这是一篇把机械脸控制从“直接回归电机”重构为“虚拟表情空间 + 可微自模型逆控制”的系统论文，真正贡献在表征对齐与硬件先验，而不是单纯的情绪生成。

PDF AlphaXiv Code Code

Interface-level Intent Inference for Environment-agnostic Robot Teleoperation Assistance figure

RSS2025Paper 081

Interface-level Intent Inference for Environment-agnostic Robot Teleoperation Assistance

Larisa Y.c. Loke, Brenna Argall

机器人学习人机交互控制数据安全SLAM/定位

这篇论文把 teleoperation 的共享控制从“理解机器人前的用户意图”前移为“恢复被接口扭曲的原始意图”，属于一种面向受限输入通道的 interface-level denoising / alignment，而非传统 robot-level intent prediction。

Sense and Sensibility: What makes an social robot convincing to high-school students? figure

RSS2025Paper 082

Sense and Sensibility: What makes an social robot convincing to high-school students?

Pablo Gonzalez-Oliveras, Olov Engwall, Ali Reza Majlesi

机器人学习视觉语言模型

这是一篇把教育机器人研究从“提升亲和力”推进到“校准可信度风险”的工作：它证明了学生会被机器人的确定性表演显著带偏，因此真正该优化的不是说服力本身，而是可信度呈现与信息可靠性的对齐。

FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization figure

RSS2025Paper 083

FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization

Rajat Kumar Jenamani, Tom Silver, Ben Dodson, Shiqin Tong, Anthony Song, Yuting Yang, Ziang Liu, Benjamin Howe, Aimee Whitneck, Tapomayukh Bhattacharjee

机器人学习安全视觉语言模型多机器人人机交互

FEAST 代表的是一种把照护机器人个性化从黑箱策略学习转向“用户可编辑、可验证、可解释的行为程序”的方法演化，而它的价值主要来自这种受约束的表示与交互设计，而不是 LLM 本身。

PDF AlphaXiv Video

Demonstrating a Control Framework for Physical Human-Robot Interaction Toward Industrial Applications figure

RSS2025Paper 084

Demonstrating a Control Framework for Physical Human-Robot Interaction Toward Industrial Applications

Bastien Muraccioli, Mathieu Celerier, Mehdi Benallegue, Gentiane Venture

机器人学习控制人机交互安全触觉

这篇论文把 pHRI 从“柔顺控制演示”推进到“带安全约束的工业级控制架构原型”，真正贡献是用 QP 层次化地统一了任务精度、可切换柔顺和底层扭矩执行，但其泛化性仍明显依赖高质量系统辨识与平台定制。

Users and Wizards in Conversations: How WoZ Interface Choices Define Human-Robot Interactions figure

RSS2025Paper 085

Users and Wizards in Conversations: How WoZ Interface Choices Define Human-Robot Interactions

Ekaterina Torubarova, Jura Miniotaite, Andre Pereira

机器人学习人机交互感知数据

这篇论文把 WoZ 从“控制机器人说什么”推进到“用界面定义交互分布”，其真正贡献是证明具身 telepresence 可能比脚本式 GUI 更接近未来社交机器人所需的数据生成机制。

Demonstrating Shared Force-Language Embeddings for Natural Human-Robot Communication figure

RSS2025Paper 086

Demonstrating Shared Force-Language Embeddings for Natural Human-Robot Communication

Ravi Tejwani, Karl Angel Velazquez, John Payne, Paolo Bonato, Haruhiko Asada

机器人学习触觉人机交互多机器人数据强化学习

这篇工作属于“把语言与触觉/力做共享表示对齐”的多模态协作路线，真正贡献是提出跨模态可交换语义空间，而不是单纯提升某个控制或语言模块。

Optimal Interactive Learning on the Job via Facility Location Planning figure

RSS2025Paper 087

Optimal Interactive Learning on the Job via Facility Location Planning

Shivam Vats, Michelle D. Zhao, Patrick Callaghan, Mingxi Jia, Maxim Likhachev, Oliver Kroemer, George Konidaris

规划机器人学习操作灵巧手多机器人人机交互

这是一篇把多任务交互学习重写成设施选址式全局成本规划的工作，核心贡献是用可近似的 OR 结构替代单任务主动学习式的局部 query 选择，从而实现更省人的长期协作。

A Robot-Assisted Approach to Small Talk Training for Adults with ASD figure

RSS2025Paper 088

A Robot-Assisted Approach to Small Talk Training for Adults with ASD

Rebecca Ramnauth, Dražen Brščić, Brian Scassellati

机器人学习

这是一篇把成人 ASD 小谈训练从“陪聊工具”推进到“家庭内自治行为教练”的系统论文，核心贡献是训练结构和反馈闭环，而不是对话智能本身。

Interruption Handling for Conversational Robots figure

RSS2025Paper 089

Interruption Handling for Conversational Robots

Shiye Cao, Jiwon Moon, Amama Mahmood, Victor Nikhil Antony, Ziang Xiao, Anqi Liu, Chien-Ming Huang

机器人学习灵巧手人机交互视觉语言模型数据控制

这是一篇把 interruption 从“turn-taking 失败”重构为“语用意图驱动的在线对话控制”的系统论文，核心贡献在于 policy 设计与人类交互范式迁移，而不是单纯的检测或生成。

ASTRID: A Robotic Tutor for Nurse Training to Reduce Healthcare-Associated Infections figure

RSS2025Paper 090

ASTRID: A Robotic Tutor for Nurse Training to Reduce Healthcare-Associated Infections

Peizhu Qian, Filip Bajraktari, Carlos Quintero-Pena, Qingxi Meng, Shannan Hamlin, Lydia E. Kavraki, Vaibhav V. Unhelkar

机器人学习可解释性

ASTRID 代表的是一种“把专家式流程监督外化为机器人可执行的实时约束反馈”的护理训练路线，核心贡献是人机共设计下的 procedural tutor，而非新的感知或学习算法。

Towards Uncertainty Unification: A Case Study for Preference Learning figure

RSS2025Paper 091

Towards Uncertainty Unification: A Case Study for Preference Learning

Shaoting Peng, Haonan Chen, Katherine Rose Driggs-Campbell

机器人学习人机交互

这是一个把“人类偏好的犹豫程度”显式并入 GP 偏好学习与主动查询的工作，本质上是在做人类不确定性与机器人不确定性的联合建模，而非单纯提升一个 preference learner 的容量。

PDF AlphaXiv Project

Demonstrating Arena 5.0: A Photorealistic ROS2 Simulation Framework for Developing and Benchmarking Social Navigation figure

RSS2025Paper 092

Demonstrating Arena 5.0: A Photorealistic ROS2 Simulation Framework for Developing and Benchmarking Social Navigation

Linh Kästner, Volodymyr Shcherbyna, Harold Soh, Giang Nguyen Huu Truong, Do Duc Anh, Ton Manh Kien, Tim Seeger, Ahmed Martban, Vu Thanh Lam, Nguyen Quoc Hung, Pham Thai Hoang Tung, Tran Dang An, Eva Wiese, Maximilian Ho-Kyoung Schreff

机器人学习导航生成模型规划

Arena 5.0 不是一个新导航方法，而是把 social navigation 研究从低保真、碎片化的仿真测试，推进到 ROS2 对齐、可扩展、可 benchmark 的高保真实验基础设施。

Safety with Agency: Human-Centered Safety Filter with Application to AI-Assisted Motorsports figure

RSS2025Paper 093

Safety with Agency: Human-Centered Safety Filter with Application to AI-Assisted Motorsports

Donggeon David Oh, Justin Lidard, Haimin Hu, Himani Sinhmar, Elle Lazarski, Deepak Edakkattil Gopinath, Emily Sumner, Jonathan Decastro, Guy Rosman, Naomi Leonard, Jaime Fernández Fisac

安全人机交互控制自动驾驶可解释性数据

这篇工作把共享自治里的安全过滤器从“最后时刻接管”改造成“基于学习到的安全值函数、对人类意图做最小侵入投影的 model-free 安全约束控制”，核心贡献是把安全与 agency 同时纳入同一个干预几何里。

Resolving Conflicting Constraints in Multi-Agent Reinforcement Learning with Layered Safety figure

RSS2025Paper 094

Resolving Conflicting Constraints in Multi-Agent Reinforcement Learning with Layered Safety

Jasmine Jerry Aloor, Jason Jangho Choi, Jingqi Li, Maria G. Mendoza, Hamsa Balakrishnan, Claire Tomlin

机器人学习安全强化学习多机器人触觉人机交互

这是一篇把多智能体安全从“统一硬约束求解”推进到“冲突稀疏化 + 局部安全修正”的分层式 MARL 论文，核心贡献是重构了安全与学习的职责分配，而不是单纯堆了一个 safety module。

PDF AlphaXiv Project

FERMI: Flexible Radio Mapping with a Hybrid Propagation Model and Scalable Autonomous Data Collection figure

RSS2025Paper 095

FERMI: Flexible Radio Mapping with a Hybrid Propagation Model and Scalable Autonomous Data Collection

Yiming Luo, Yunfei Wang, Hongming Chen, Chengkai Wu, Ximin Lyu, Jinni Zhou, Jun Ma, Fu Zhang, Boyu Zhou

机器人学习数据SLAM/定位多机器人人机交互规划

FERMI 是把 radio mapping 从端到端黑箱拟合重构为“物理先验残差学习 + 多机器人并行采集”的结构化方案，核心贡献在于提升稀疏数据下的外推与构图效率，而不是单纯提高回归精度。

PDF AlphaXiv Code

Online Competitive Information Gathering for Partially Observable Trajectory Games figure

RSS2025Paper 096

Online Competitive Information Gathering for Partially Observable Trajectory Games

Mel Krusniak, Hang Xu, Forrest John Laine

操作感知规划

这是一篇把连续 POSG 的主动信息获取从离线/低阶 belief 近似，推进到在线 joint-history 轨迹博弈建模的工作，真正贡献在于重构了信息与规划的耦合方式，而不是某个单独优化器。

Collaborative Object Transportation in Space via Impact Interactions figure

RSS2025Paper 097

Collaborative Object Transportation in Space via Impact Interactions

Joris Verhagen, Jana Tumova

机器人学习控制人机交互规划

这篇论文把微重力协同搬运从“连续推拉控制”改写成“基于碰撞事件的 STL 约束编排”，核心贡献是用冲击作为主控制通道重塑了可规划性，而不是单纯提升了接触控制精度。

PDF AlphaXiv Project

APEX-MR: Multi-Robot Asynchronous Planning and Execution for Cooperative Assembly figure

RSS2025Paper 098

APEX-MR: Multi-Robot Asynchronous Planning and Execution for Cooperative Assembly

Philip Huang, Ruixuan Liu, Shobhit Aggarwal, Changliu Liu, Jiaoyang Li

机器人学习操作多机器人规划安全灵巧手

APEX-MR 的实质贡献，是把多机器人协作装配从“联合并行规划问题”改写成“顺序骨架上的依赖驱动异步执行问题”，其创新主要在执行层的部分序化，而不是更复杂的联合规划。

PDF AlphaXiv Project

Hierarchical Temporal Logic Task and Motion Planning for Multi-Robot Systems figure

RSS2025Paper 099

Hierarchical Temporal Logic Task and Motion Planning for Multi-Robot Systems

Zhongqi Wei, Xusheng Luo, Changliu Liu

机器人学习规划多机器人导航操作灵巧手

这是一篇把 multi-robot TAMP 从“任务搜索 + 轨迹优化”重写为“层级逻辑驱动的产品图最短路”的工作，核心贡献在于用更强的结构化表示把任务分配和连续规划统一进可扩展的求解框架。

A Probabilistic Measure of Multi-Robot Connectivity and Ergodic Optimal Control figure

RSS2025Paper 100

A Probabilistic Measure of Multi-Robot Connectivity and Ergodic Optimal Control

Yongce Liu, Zhongqiang Ren

机器人学习多机器人控制规划安全

这篇工作把多机器人间歇连通性从显式会合调度，重写成与 ergodic search 同尺度的轨迹统计约束，从而把信息覆盖与通信维护统一进一个连续最优控制框架。

How to Coordinate UAVs and UGVs for Efficient Mission Planning? Optimizing Energy-Constrained Cooperative Routing with a DRL Framework figure

RSS2025Paper 101

How to Coordinate UAVs and UGVs for Efficient Mission Planning? Optimizing Energy-Constrained Cooperative Routing with a DRL Framework

Mohammad Safwan Mondal, Subramanian Ramasamy, Pranav Bhounsule

强化学习规划多机器人自动驾驶安全触觉

这篇论文把 UAV-UGV 协同规划从全局联合优化重构为 sortie 级的异构序列决策，用 transformer + 可行性约束实现了更可扩展的学习式调度/路由器，但其核心增益更像是结构化分解与搜索预算，而非纯粹的端到端推理突破。

PDF AlphaXiv Project

Influence of Static and Dynamic Downwash Interactions on Multi-Quadrotor Systems figure

RSS2025Paper 102

Influence of Static and Dynamic Downwash Interactions on Multi-Quadrotor Systems

Anoop Kiran, Nora Ayanian, Kenneth Breuer

机器人学习人机交互自动驾驶数据触觉导航

这是一篇把多旋翼下洗从“经验性安全区问题”推进到“可归一化、可测量、可建模的相对位姿气动耦合问题”的实验型基础工作。

DexterityGen: Foundation Controller for Unprecedented Dexterity figure

RSS2025Paper 103

DexterityGen: Foundation Controller for Unprecedented Dexterity

Zhao-Heng Yin, Changhao Wang, Luis Pineda, Francois Robert Hogan, Chaithanya Krishna Bodduluri, Akash Sharma, Patrick Lancaster, Ishita Prasad, Mrinal Kalakrishnan, Jitendra Malik, Mike Lambeta, Tingfan Wu, Pieter Abbeel, Mustafa Mukadam

机器人学习灵巧手控制强化学习操作数据

DexterityGen 本质上是把灵巧操作做成一个可被高层提示调用的生成式低层动作先验；它的贡献更像是数据覆盖驱动的控制架构重组，而不是单纯的单任务 policy 提升。

DOGlove: Dexterous Manipulation with a Low-Cost Open-Source Haptic Force Feedback Glove figure

RSS2025Paper 104

DOGlove: Dexterous Manipulation with a Low-Cost Open-Source Haptic Force Feedback Glove

Han Zhang, Songbo Hu, Zhecheng Yuan, Huazhe Xu

机器人学习触觉灵巧手操作人机交互模仿学习

DOGlove 代表的是一条“用低成本闭环触觉/力反馈接口提升灵巧手遥操作与示范质量”的系统路线，其真正贡献是把 contact-rich manipulation 的关键状态重新嵌回人的感觉回路，而非提出新的学习算法。

PDF AlphaXiv Project

Dexonomy: Synthesizing All Dexterous Grasp Types in a Grasp Taxonomy figure

RSS2025Paper 105

Dexonomy: Synthesizing All Dexterous Grasp Types in a Grasp Taxonomy

Jiayi Chen, Yubin Ke, Lin Peng, He Wang

机器人学习灵巧手数据基础模型生成模型感知

Dexonomy 不是在发明新的抓取优化，而是在用“类型模板 + 物体先对齐 + 局部物理精修”的方式，把灵巧抓取从单样本规划变成了可规模化生成 taxonomy 数据的结构化管线。

PDF AlphaXiv Project

Dex1B: Learning with 1B Demonstrations for Dexterous Manipulation figure

RSS2025Paper 106

Dex1B: Learning with 1B Demonstrations for Dexterous Manipulation

Jianglong Ye, Keyi Wang, Chengjing Yuan, Ruihan Yang, Yiquan Li, Jiyue Zhu, Yuzhe Qin, Xueyan Zou, Xiaolong Wang

机器人学习模仿学习灵巧手数据操作生成模型

Dex1B 的本质是把灵巧操作从“小规模优化示范学习”推进到“带几何归纳偏置的迭代式数据扩张”，其核心贡献更像一个可扩展的数据生产范式，而不是单纯一个更大的数据集。

Demonstrating Multi-Suction Item Picking at Scale via Multi-Modal Learning of Pick Success figure

RSS2025Paper 107

Demonstrating Multi-Suction Item Picking at Scale via Multi-Modal Learning of Pick Success

Che Wang, Jeroen Vanbaar, Chaitanya Mitash, Shuai Li, Dylan Randle, Weiyao Wang, Sumedh Anand Sontakke, Kostas Bekris, Kapil Katyal

机器人学习操作数据感知安全

这是一个典型的工业机器人表征学习升级案例：用域内多模态预训练+条件化读出，把原本依赖人工特征的抓取成功判别，推进到可从真实执行日志中规模化学习的任务相关表示。

Vib2Move: In-hand Object Reconfiguration via Fingertip Micro-vibrations figure

RSS2025Paper 108

Vib2Move: In-hand Object Reconfiguration via Fingertip Micro-vibrations

Xili Yi, Nima Fazeli

操作灵巧手触觉规划

这是一篇把平行夹爪的手内重配置从“精细力控”重构为“振动调摩擦 + 准静态滑移 + 视觉闭环”的工作，核心贡献是提供了一个低成本、可规划的接触状态控制接口，而不是通用灵巧操控能力。

PDF AlphaXiv Project

Sim-and-Real Co-Training: A Simple Recipe for Vision-Based Robotic Manipulation figure

RSS2025Paper 109

Sim-and-Real Co-Training: A Simple Recipe for Vision-Based Robotic Manipulation

Abhiram Maddukuri, Zhenyu Jiang, Lawrence Yunliang Chen, Soroush Nasiriany, Yuqi Xie, Yu Fang, Wenqi Huang, Zu Wang, Zhenjia Xu, Nikita Chernyadev, Scott Reed, Ken Goldberg, Ajay Mandlekar, Linxi Fan, Yuke Zhu

数据操作感知基础模型生成模型机器人学习

这是一篇把 sim-to-real 从“精确转移问题”改写为“语义对齐的数据混合问题”的论文：它的核心贡献不是更逼真的仿真，而是证明并系统化了仿真数据在真实机器人操作联合训练中的有效条件与边界。

CordViP: Correspondence-based Visuomotor Policy for Dexterous Manipulation in Real-World figure

RSS2025Paper 110

CordViP: Correspondence-based Visuomotor Policy for Dexterous Manipulation in Real-World

Yankai Fu, Ning Chen, Qiuxuan Feng, Zichen Zhou, Mengzhen Liu, Mingdong Wu, Tianxing Chen, Shanyu Rong, Jiaming Liu, Hao Dong, Shanghang Zhang

机器人学习灵巧手感知操作模仿学习SLAM/定位

CordViP 属于“以对象-手对应为中心的灵巧操作表示学习”路线：它不是单纯增强 3D 感知，而是把接触和几何对应显式化，从而让真实世界 dexterous manipulation 更稳、更可泛化。

PDF AlphaXiv Project

Complementarity-Free Multi-Contact Modeling and Optimization for Dexterous Manipulation figure

RSS2025Paper 111

Complementarity-Free Multi-Contact Modeling and Optimization for Dexterous Manipulation

Wanxin Jin

机器人学习操作灵巧手控制规划感知

这是一次把多接触互补约束重写成可微闭式对偶映射的建模层创新，核心价值在于显著提升 contact-implicit MPC 的实时性与可优化性，而不是追求更高保真的接触物理。

Safe Beyond the Horizon: Efficient Sampling-based MPC with Neural Control Barrier Functions figure

RSS2025Paper 112

Safe Beyond the Horizon: Efficient Sampling-based MPC with Neural Control Barrier Functions

Ji Yin, Oswin So, Eric Yang Yu, Chuchu Fan, Panagiotis Tsiotras

规划控制安全灵巧手

这是一篇把“长期安全”从难求的终端可行性问题，重写为“学习离散时间安全边界并用低方差采样执行”的采样式 MPC 论文，核心贡献在于安全 inductive bias，而非单纯更强的优化器。

PDF AlphaXiv Project

Generalizing Safety Beyond Collision-Avoidance via Latent-Space Reachability Analysis figure

RSS2025Paper 113

Generalizing Safety Beyond Collision-Avoidance via Latent-Space Reachability Analysis

Kensuke Nakamura, Lasse Peters, Andrea Bajcsy

机器人学习安全生成模型控制灵巧手模仿学习

这篇论文把 HJ reachability 从手工 state-space 的碰撞规避，推进到生成式 latent space 上的视觉失败安全过滤，核心贡献是把“不可手写的安全约束”变成“可学习、可传播、可插拔的表示空间安全问题”。

Bridging Model Predictive Control and Deep Learning for Scalable Reachability Analysis figure

RSS2025Paper 114

Bridging Model Predictive Control and Deep Learning for Scalable Reachability Analysis

Zeyuan Feng, Le Qiu, Somil Bansal

控制规划安全机器人学习感知

这篇论文把 HJ reachability 的学习难题从“靠残差硬拟合 PDE”改写成“用 MPC 提供结构化监督、再用 DeepReach 做全局一致性整合”的闭环学习问题，本质上是一次面向可扩展性的训练信号重构。

Distilling Contact Planning for Fast Trajectory Optimization in Robot Air Hockey figure

RSS2025Paper 115

Distilling Contact Planning for Fast Trajectory Optimization in Robot Air Hockey

Julius Jankowski, Ante Marić, Puze Liu, Davide Tateo, Jan Peters, Sylvain Calinon

规划控制机器人学习安全导航

这是一个把接触规划做成“可蒸馏的随机最优控制”，再用在线 MPC 执行的混合方法；它的本质贡献是用结构化接触建模和低维决策分解，把原本难以实时求解的动态击打问题压缩成可部署的高层接触选择。

Leveling the Playing Field: Carefully Comparing Classical and Learned Controllers for Quadrotor Trajectory Tracking figure

RSS2025Paper 116

Leveling the Playing Field: Carefully Comparing Classical and Learned Controllers for Quadrotor Trajectory Tracking

Pratik Kunapuli, Jake Welde, Dinesh Jayaraman, Vijay Kumar

控制强化学习机器人学习自动驾驶数据触觉

这是一篇把 quadrotor learned-vs-classical control 的“性能之争”重新还原为“信息边界与评测协议之争”的论文：它的主要贡献不是新控制器，而是证明很多 RL 优势其实来自不对称 benchmark。

PDF AlphaXiv Project

A Generic Continuous Multi-Joint Spinal Robotic System for Agile and Accurate Behaviors with GNN-MPC method figure

RSS2025Paper 117

A Generic Continuous Multi-Joint Spinal Robotic System for Agile and Accurate Behaviors with GNN-MPC method

Ying Wu, Zida Zhou, Renming Liu, Lanxiang Zheng, Hui Cheng

控制规划安全机器人学习触觉

这是一个把仿生脊柱机构、图结构参数辨识和约束型 MPC 绑定起来的高动态机器人系统工作，本质上是在用更强的结构先验和更好的动态约束建模，去替代纯策略学习对脊柱行为的控制。

Behavior Synthesis via Contact-Aware Fisher Information Maximization figure

RSS2025Paper 118

Behavior Synthesis via Contact-Aware Fisher Information Maximization

Hrishikesh Sathyanarayan, Ian Abraham

机器人学习数据人机交互控制

这篇论文把接触学习从“用交互数据做估计”推进到“为可辨识性主动合成接触行为”，本质上是一次以 Fisher information 为核心的 contact-aware active experiment design。

Geometric Gait Optimization for Kinodynamic Systems Using a Lie Group Integrator figure

RSS2025Paper 119

Geometric Gait Optimization for Kinodynamic Systems Using a Lie Group Integrator

Yanhao Yang, Ross Hatton

机器人学习安全导航规划控制

这篇论文把 kinodynamic locomotion 从“长轨迹最优控制”重写成“基于 Lie group 结构的 gait 原语优化与拼接”，核心贡献是更好的几何/动力学 inductive bias，而不是更大的搜索或数据规模。

Riemannian Direct Trajectory Optimization of Rigid Bodies on Matrix Lie Groups figure

RSS2025Paper 120

Riemannian Direct Trajectory Optimization of Rigid Bodies on Matrix Lie Groups

Sangli Teng, Tzu-Yuan Lin, William A. Clark, Ram Vasudevan, Maani Ghaffari

机器人学习规划控制安全

这篇工作把刚体轨迹优化从“参数化后做数值优化”推进到“在 Lie group 上直接做带约束的二阶 Riemannian 优化”，核心贡献是几何建模与求解器结构的对齐，而不是单纯的算法堆叠。

Provably-Safe, Online System Identification figure

RSS2025Paper 121

Provably-Safe, Online System Identification

Bohao Zhang, Zichang Zhou, Ram Vasudevan

机器人学习安全操作规划控制

这篇论文把未知负载辨识从“先冒险采数据再拟合”改造成“在可证安全的探索轨道上持续收紧参数集合”的闭环方法，属于安全主动辨识而非传统系统辨识的增量优化。

PDF AlphaXiv Project

Human2LocoMan: Learning Versatile Quadrupedal Manipulation with Human Pretraining figure

RSS2025Paper 122

Human2LocoMan: Learning Versatile Quadrupedal Manipulation with Human Pretraining

Yaru Niu, Yunzhe Zhang, Mingyang Yu, Changyi Lin, Chenhao Li, Yikai Wang, Yuxiang Yang, Wenhao Yu, Tingnan Zhang, Zhenzhen Li, Jonathan Francis, Bingqing Chen, Jie Tan, Ding Zhao

Carnegie Mellon University；Google DeepMind

机器人学习数据腿足机器人操作模仿学习人机交互

这是一个把人类演示变成四足操作预训练信号的跨实体模仿学习工作，其真正贡献在于用模态级对齐和模块化共享表示，把原本难以迁移的人-机差异压缩成可学习的接口问题。

PDF AlphaXiv Project

Gain Tuning Is Not What You Need: Reward Gain Adaptation for Constrained Locomotion Learning figure

RSS2025Paper 123

Gain Tuning Is Not What You Need: Reward Gain Adaptation for Constrained Locomotion Learning

Arthicha Srisuchinnawong, Poramate Manoonpong

机器人学习强化学习腿足机器人安全人机交互

ROGER 不是在 constrained locomotion 里‘再造一个更强的优化器’，而是把 reward 权重做成随风险闭环自调的控制变量，从而用更快的目标重整合来替代传统 dual 更新的滞后性。

SATA: Safe and Adaptive Torque-Based Locomotion Policies Inspired by Animal Learning figure

RSS2025Paper 124

SATA: Safe and Adaptive Torque-Based Locomotion Policies Inspired by Animal Learning

Li Peizhuo, Hongyi Li, Ge Sun, Jin Cheng, Xinrong Yang, Guillaume Bellegarda, Milad Shafiee Ashtiani, Yuhong Cao, Auke Ijspeert, Guillaume Adrien Sartoretti

安全控制腿足机器人机器人学习仿真到现实人机交互

SATA 的本质是把腿足 locomotion 从“姿态跟踪+后端补偿”推进到“直接力矩交互+动物式探索先验”的路线，用更强的物理归纳偏置去换取安全、顺应和零样本迁移。

Bridging the Sim-to-Real Gap for Athletic Loco-Manipulation figure

RSS2025Paper 125

Bridging the Sim-to-Real Gap for Athletic Loco-Manipulation

Nolan Fey, Gabriel B. Margolis, Martin Peticco, Pulkit Agrawal

机器人学习强化学习操作移动操作仿真到现实数据

这篇论文提出了一条面向高动态机器人操作的 sim-to-real 路线：先用无 torque 标签的 residual actuator model 校准复杂致动器，再用 reference-hint curriculum 让 whole-body policy 从可跟踪的运动先验中偏移到任务最优解。

Adaptive Locomotion on Mud through Proprioceptive Sensing of Substrate Properties figure

RSS2025Paper 126

Adaptive Locomotion on Mud through Proprioceptive Sensing of Substrate Properties

Shipeng Liu, Jiaze Tang, Siyuan Meng, Feifei Qian

机器人学习腿足机器人触觉数据

这篇论文把泥地适应从“识别地形再调参”推进到“用本体感知反演泥土物理参数并直接闭环控制”，属于基于物理 inductive bias 的 proprioceptive terrain estimation，而不是数据驱动地形分类。

Discrete-Time Hybrid Automata Learning: Legged Locomotion Meets Skateboarding figure

RSS2025Paper 127

Discrete-Time Hybrid Automata Learning: Legged Locomotion Meets Skateboarding

Hang Liu, Sangli Teng, Ben Liu, Wei Zhang, Maani Ghaffari

机器人学习腿足机器人感知控制强化学习触觉

这篇工作把一个复杂接触任务重写成带显式模式结构的 RL 问题，用 multi-critic 和 Beta policy 去做结构化信用分配，核心价值在于 hybrid inductive bias，而不是单纯更强的策略网络。

SafeMimic: Towards Safe and Autonomous Human-to-Robot Imitation for Mobile Manipulation figure

RSS2025Paper 128

SafeMimic: Towards Safe and Autonomous Human-to-Robot Imitation for Mobile Manipulation

Arpit Bahety, Arnav Balaji, Ben Abbatematteo, Roberto Martín-Martín

机器人学习安全操作移动操作模仿学习灵巧手

SafeMimic 代表的是一种“从单次人类视频抽取任务骨架，再用安全约束搜索完成机器人适配”的方法谱系，它的真正贡献是把视频模仿、风险过滤和失败回溯整合成了可在真实 mobile manipulation 中运行的自主学习闭环。

PDF AlphaXiv Video

Demonstrating DVS: Dynamic Virtual-Real Simulation Platform for Mobile Robotic Tasks figure

RSS2025Paper 129

Demonstrating DVS: Dynamic Virtual-Real Simulation Platform for Mobile Robotic Tasks

Zijie Zheng, Zeshun Li, Yunpeng Wang, Qinghongbing Xie, Long Zeng

机器人学习数据导航灵巧手视觉语言模型基础模型

DVS 属于“面向虚实闭环的机器人基础设施”而非算法论文，它真正推进的是把动态、可编辑、可同步的环境变成移动机器人多任务学习与真实验证的共同底座。

PDF AlphaXiv Project

Flying Hand: End-Effector-Centric Framework for Versatile Aerial Manipulation Teleoperation and Policy Learning figure

RSS2025Paper 130

Flying Hand: End-Effector-Centric Framework for Versatile Aerial Manipulation Teleoperation and Policy Learning

Guanqi He, Xiaofeng Guo, Luyi Tang, Yuanhang Zhang, Mohammadreza Mousaei, Jiahe Xu, Junyi Geng, Sebastian Scherer, Guanya Shi

操作控制灵巧手人机交互机器人学习模仿学习

这是一篇把 aerial manipulation 从“任务专用系统集合”推进到“末端执行器中心的通用操作框架”的工作，核心贡献是接口与分层抽象，而不是单点控制性能。

PDF AlphaXiv Project

RUKA: Rethinking the Design of Humanoid Hands with Learning figure

RSS2025Paper 131

RUKA: Rethinking the Design of Humanoid Hands with Learning

Anya Zorin, Irmak Guzey, Nikhil X. Bhattasali, Lerrel Pinto

灵巧手腿足机器人操作数据控制机器人学习

RUKA 不是在追求更强的灵巧手模型，而是在用人形硬件形态对齐和数据驱动逆控制，把低成本 tendon-driven 手从“难以控制的硬件”变成“可复用的研究平台”。

PDF AlphaXiv Project

Demonstrating LEAP Hand v2: Low-Cost, Easy-to-Assemble, High-Performance Hand for Robot Learning figure

RSS2025Paper 132

Demonstrating LEAP Hand v2: Low-Cost, Easy-to-Assemble, High-Performance Hand for Robot Learning

Kenneth Shaw, Deepak Pathak

灵巧手机器人学习感知腿足机器人模仿学习人机交互

这是一篇把低成本灵巧手从“可展示的工程件”推进到“可用于机器人学习的研究基础设施”的系统性 demo 论文，其核心贡献是平台化与归纳偏置重构，而不是新的学习算法。

Tactile sensing enables vertical obstacle negotiation for elongate many-legged robots figure

RSS2025Paper 133

Tactile sensing enables vertical obstacle negotiation for elongate many-legged robots

Juntao He, Baxi Chong, Massimiliano Iaschi, Vincent R. Nienhusser, Sehoon Ha, Daniel Goldman

机器人学习腿足机器人触觉控制导航感知

这是把 many-legged 机器人的垂直越障从视觉全局规划，转成触觉驱动的局部闭环 skill 的一篇工作，本质贡献是利用形态冗余与低带宽触觉建立了更适合该平台的爬障 inductive bias。

Boxi: Design Decisions in the Context of Algorithmic Performance for Robotics figure

RSS2025Paper 134

Boxi: Design Decisions in the Context of Algorithmic Performance for Robotics

Jonas Frey, Turcan Tuna, Lanke Frank Tarimo Fu, Cedric Weibel, Katharine Patterson, Benjamin Krummenacher, Matthias Müller, Julian Nubert, Maurice Fallon, Cesar Cadena, Marco Hutter

机器人学习操作腿足机器人SLAM/定位

这是一篇把机器人感知平台设计从“隐性工程经验”提升为“影响状态估计上限的研究问题”的系统论文，核心贡献在于证明并沉淀了传感器模态、同步和标定对算法性能的决定性作用。

PDF AlphaXiv Code

emg2tendon: From sEMG Signals to Tendon Control in Musculoskeletal Hands figure

RSS2025Paper 135

emg2tendon: From sEMG Signals to Tendon Control in Musculoskeletal Hands

Sagar Verma

机器人学习灵巧手控制数据操作SLAM/定位

这是一篇把 EMG-to-pose 重新改写成 EMG-to-executable tendon control 的工作，核心贡献是通过肌骨模拟重定义监督空间，并用 diffusion 学一个更接近真实执行层的控制表示。

PDF AlphaXiv Project

CREStE: Scalable Mapless Navigation with Internet Scale Priors and Counterfactual Guidance figure

RSS2025Paper 136

CREStE: Scalable Mapless Navigation with Internet Scale Priors and Counterfactual Guidance

Arthur Zhang, Harshit Sikchi, Joydeep Biswas, Amy Zhang

导航强化学习模仿学习可解释性机器人学习基础模型

CREStE属于“基础模型先验 + counterfactual局部对齐 + 模块化规划”的导航路线，它真正推动的是把开放世界感知和专家约束从端到端策略里拆出来，重新做成可泛化的BEV代价学习。

PDF AlphaXiv Project

Dynamic Safety in Complex Environments: Synthesizing Safety Filters with Poisson’s Equation figure

RSS2025Paper 137

Dynamic Safety in Complex Environments: Synthesizing Safety Filters with Poisson’s Equation

Gilbert Bahati, Ryan M. Bena, Aaron Ames

机器人学习安全腿足机器人控制模仿学习数据

这是把动态环境中的 safe set synthesis 从启发式势场/距离场，推进到“由 Poisson 椭圆方程生成、可直接接入 CBF 的安全函数”这一类方法的工作，核心贡献是结构化 inductive bias 和可部署的 perception-to-safety 接口。

Verti-Bench: A General and Scalable Off-Road Mobility Benchmark for Vertically Challenging Terrain figure

RSS2025Paper 138

Verti-Bench: A General and Scalable Off-Road Mobility Benchmark for Vertically Challenging Terrain

Tong Xu, Chenhui Pan, Madhan B. Rao, Aniket Datar, Anuj Pokhrel, Yuanjie Lu, Xuesu Xiao

机器人学习数据自动驾驶导航强化学习模仿学习

Verti-Bench 不是在提出新导航算法，而是在把极端越野 mobility 的研究重心从零散演示转向可复现、可扩展、以交互为核心的标准化评测基础设施。

PDF AlphaXiv Project

Meta-Learning Online Dynamics Model Adaptation in Off-Road Autonomous Driving figure

RSS2025Paper 139

Meta-Learning Online Dynamics Model Adaptation in Off-Road Autonomous Driving

Jacob Levy, Jason Gibson, Bogdan Vlahov, Erica Tevere, Evangelos Theodorou, David Fridovich-Keil, Patrick Spieler

控制自动驾驶安全数据人机交互视觉语言模型

这篇工作属于“把越野场景下的在线动力学学习，从高维重训练改写为 meta-learned 低维子空间滤波”的方法演化，核心贡献是把可部署的自适应控制做成了一个更合理的结构化识别问题。

PDF AlphaXiv Video

Enhancing Autonomous Driving Systems with On-Board Deployed Large Language Models figure

RSS2025Paper 140

Enhancing Autonomous Driving Systems with On-Board Deployed Large Language Models

Nicolas Baumann, Cheng Hu, Paviththiren Sivasothilingam, Haotong Qin, Lei Xie, Michele Magno, Luca Benini

机器人学习视觉语言模型自动驾驶控制规划安全

这篇论文代表的是“LLM 作为本地、受约束的语义控制中间层”这一条路线：它真正贡献的是把自然语言意图、安全 MPC 和边缘部署组织成一个可运行接口，而不是提出了一种新的自动驾驶决策范式。

Demonstrating CavePI: Autonomous Exploration of Underwater Caves by Semantic Guidance figure

RSS2025Paper 141

Demonstrating CavePI: Autonomous Exploration of Underwater Caves by Semantic Guidance

Alankrit Gupta, Adnan Abdullah, Xianyao Li, Vaishnav Ramesh, Ioannis Rekleitis, Md Jahidul Islam

机器人学习感知导航自动驾驶安全数据

这是一个把水下洞穴导航从“全局自主探索”收缩为“沿人类语义骨架进行边缘可部署闭环跟踪”的系统型工作，核心贡献在任务重构而非算法突破。

PDF AlphaXiv Code

RAPID: Robust and Agile Planner Using Inverse Reinforcement Learning for Vision-Based Drone Navigation figure

RSS2025Paper 142

RAPID: Robust and Agile Planner Using Inverse Reinforcement Learning for Vision-Based Drone Navigation

Minwoo Kim, Geunsik Bae, Jinwoo Lee, Woojae Shin, Changseung Kim, Myongyol Choi, Heejung Shin, Hyongdong Oh

强化学习感知导航规划触觉数据

RAPID 不是简单把 BC 换成 IRL，而是用带特权地图的规划专家重构视觉导航的监督形式，把高速无人机局部规划从动作拟合推进到奖励恢复驱动的策略学习。

PDF AlphaXiv Video

Neural Inertial Odometry from Lie Events figure

RSS2025Paper 143

Neural Inertial Odometry from Lie Events

Royina Karegoudra Jayanth, Yinshuang Xu, Evangelos Chatzipantazis, Kostas Daniilidis, Daniel Gehrig

SLAM/定位操作数据感知

这篇论文把 IMU 里的 neural displacement prior 从“学习原始等频序列到位移”推进到“先在 SE(3) 预积分上做 Lie event canonicalization，再让现成 prior 学更稳的变化表示”，核心贡献是输入层的不变性重构，而不是更强的下游推理模型。

Uncertainty-Aware Trajectory Prediction via Rule-Regularized Heteroscedastic Deep Classification figure

RSS2025Paper 144

Uncertainty-Aware Trajectory Prediction via Rule-Regularized Heteroscedastic Deep Classification

Kumar Manas, Christian Schlauch, Adrian Paschke, Christian Wirth, Nadja Klein

数据机器人学习自动驾驶安全操作视觉语言模型

这是一篇把轨迹预测从“纯数据拟合”推进到“规则先验约束下的校准型概率分类”的工作，核心贡献是用 LLM 规模化注入交通规则，再用 heteroscedastic SNGP 让多模态预测在低数据和 OOD 场景里更可信。

PDF AlphaXiv Project

Prompting with the Future: Open-World Model Predictive Control with Interactive Digital Twins figure

RSS2025Paper 145

Prompting with the Future: Open-World Model Predictive Control with Interactive Digital Twins

Chuanruo Ning, Kuan Fang, Wei-Chiu Ma

机器人学习控制视觉语言模型操作生成模型感知

这篇 RSS 2025 的工作本质上是把 VLM 控制从“当前观测上的隐式物理推理”改造成“基于数字孪生未来结果的 MPC 搜索”，核心贡献是一个更适合 VLM 的控制接口，而不是一个新的端到端控制器。

Novel Demonstration Generation with Gaussian Splatting Enables Robust One-Shot Manipulation figure

RSS2025Paper 146

Novel Demonstration Generation with Gaussian Splatting Enables Robust One-Shot Manipulation

Sizhe Yang, Wenye Yu, Jia Zeng, Jun Lv, Kerui Ren, Cewu Lu, Dahua Lin, Jiangmiao Pang

机器人学习感知数据模仿学习操作生成模型

这篇工作把机器人示范增强从 2D 图像编辑推进到 3DGS 驱动的空间一致性示范生成，本质上是在用更强的 3D inductive bias 和更好的标签传播来替代昂贵的真实采集与脆弱的 sim2real。

STDArm: Transfer Visuomotor Policy From Static Data Training to Dynamic Robot Manipulation figure

RSS2025Paper 147

STDArm: Transfer Visuomotor Policy From Static Data Training to Dynamic Robot Manipulation

Yifan Duan, Heng Li, Yilong Wu, Wenhao Yu, Xinran Zhang, Yedong Shen, Jianmin Ji, Yanyong Zhang

机器人学习操作数据移动操作腿足机器人控制

STDArm 代表的是一种执行层迁移路线：不重做动态策略学习，而是用高频控制、运动预测和时延校准，把静态训练的 visuomotor policy 变成能在移动平台上实时工作的系统。

PartInstruct: Part-level Instruction Following for Fine-grained Robot Manipulation figure

RSS2025Paper 148

PartInstruct: Part-level Instruction Following for Fine-grained Robot Manipulation

Yifan Yin, Zhengtao Han, Shivam Aarya, Shuhang Xu, Jianxin Wang, Jiawei Peng, Angtian Wang, Alan Yuille, Tianmin Shu

操作感知数据模仿学习基础模型机器人学习

PartInstruct 的本质贡献，是把机器人细粒度操作从“语言到动作”的粗粒度跟随，推进到“语言到部件到 3D 子目标再到动作”的结构化学习，并用数据和评测把这条链条钉住了。

You Only Teach Once: Learn One-Shot Bimanual Robotic Manipulation from Video Demonstrations figure

RSS2025Paper 149

You Only Teach Once: Learn One-Shot Bimanual Robotic Manipulation from Video Demonstrations

Huayi Zhou, Ruixiang Wang, Yunxin Tai, Yueci Deng, Guiliang Liu, Kui Jia

机器人学习灵巧手操作模仿学习人机交互扩散策略

这篇论文把双臂操作从“靠大量机器人示教学连续控制”改写成“从一次人类视频中提取协作骨架，再通过结构化扩增训练任务专用策略”，其核心贡献更像数据与表示的重参数化，而不是单纯的新策略网络。

PDF AlphaXiv Project

Manual2Skill: Learning to Read Manuals and Acquire Robotic Skills for Furniture Assembly Using Vision-Language Models figure

RSS2025Paper 150

Manual2Skill: Learning to Read Manuals and Acquire Robotic Skills for Furniture Assembly Using Vision-Language Models

Chenrui Tie, Shengxiang Sun, Jinxuan Zhu, Yiwei Liu, Jingxiang Guo, Yue Hu, Haonan Chen, Junting Chen, Ruihai Wu, Lin Shao

操作视觉语言模型感知机器人学习导航SLAM/定位

这是把手册理解改写成“结构图生成 + 几何落地 + 规划执行”的家具装配系统，核心价值在于强 inductive bias，而不是端到端智能。

PDF AlphaXiv Project

Sketch-to-Skill: Bootstrapping Robot Learning with Human Drawn Trajectory Sketches figure

RSS2025Paper 151

Sketch-to-Skill: Bootstrapping Robot Learning with Human Drawn Trajectory Sketches

Peihong Yu, Amisha Bhaskar, Anukriti Singh, Zahiruddin Mahammad, Pratap Tokekar

模仿学习强化学习操作机器人学习数据感知

这是一个把人类草图从任务条件改造成 RL 初始数据来源的示范增强方法，本质上属于用弱先验重塑机器人学习起点的 bootstrapping 路线。

RoboMIND: Benchmark on Multi-embodiment Intelligence Normative Data for Robot Manipulation figure

RSS2025Paper 152

RoboMIND: Benchmark on Multi-embodiment Intelligence Normative Data for Robot Manipulation

Kun Wu, Chengkai Hou, Jiaming Liu, Zhengping Che, Xiaozhu Ju, Zhuqin Yang, Meng Li, Yinuo Zhao, Zhiyuan Xu, Guang Yang, Shichao Fan, Xinhua Wang, Fei Liao, Zhen Zhao, Guangyu Li, Zhao Jin, Lecheng Wang, Jilei Mao, Ning Liu, Pei Ren, Qiang Zhang, Yaoxu Lyu, Mengzhen Liu, He Jingyang, Yulin Luo, Zeyu Gao, Chenxuan Li, Chenyang Gu, Yankai Fu, Di Wu, Xingyu Wang, Sixiang Chen, Zhenyu Wang, Pengju An, Siyuan Qian, Shanghang Zhang, Jian Tang

机器人学习数据操作模仿学习视觉语言模型灵巧手

RoboMIND 不是在提出新的操控算法，而是在用统一采集规范和多 embodiment 高覆盖数据，把 robot manipulation 从“零散数据驱动的局部模仿”推进到“可规模化训练通用策略”的基础设施阶段。

PDF AlphaXiv Project

PIN-WM: Learning Physics-INformed World Models for Non-Prehensile Manipulation figure

RSS2025Paper 153

PIN-WM: Learning Physics-INformed World Models for Non-Prehensile Manipulation

Wenxuan Li, Hang Zhao, Zhiyuan Yu, Yu Du, Qin Zou, Ruizhen Hu, Kai Xu

机器人学习操作生成模型仿真到现实感知控制

PIN-WM 把非抓取操作从“学动作”改写成“从视觉辨识物理并在物理邻域内做鲁棒策略学习”的问题，它的核心贡献是用可微物理把少样本世界模型做成了可迁移的 Sim2Real 中间层。

Hierarchical and Modular Network on Non-prehensile Manipulation in General Environments figure

RSS2025Paper 154

Hierarchical and Modular Network on Non-prehensile Manipulation in General Environments

Yoonyoung Cho, Junhyek Han, Jisu Han, Beomjoon Kim

机器人学习操作安全强化学习灵巧手基础模型

这篇论文把非预抓取操作从“一个策略拟合所有场景”改成“基于几何约束的模块化技能路由”，核心贡献是给环境变化引入了更合适的控制归纳偏置，而不是单纯堆大模型。

Bridging Perception and Action: Spatially-Grounded Mid-Level Representations for Robot Generalization figure

RSS2025Paper 155

Bridging Perception and Action: Spatially-Grounded Mid-Level Representations for Robot Generalization

Jonathan Heewon Yang, Chuyuan Fu, Dhruv Shah, Dorsa Sadigh, Fei Xia, Tingnan Zhang

感知灵巧手扩散策略机器人学习操作模仿学习

这篇工作把灵巧机器人泛化从“端到端学动作”推进到“以空间中层表征做结构化路由与监督”，核心价值是更好的归纳偏置，而不是更大的模型。

ArticuBot: Learning Universal Articulated Object Manipulation Policy via Large Scale Simulation figure

RSS2025Paper 156

ArticuBot: Learning Universal Articulated Object Manipulation Policy via Large Scale Simulation

Yufei Wang, Ziyu Wang, Mino Nakura, Pratik Bhowal, Chia-Liang Kuo, Yi-Ting Chen, Zackory Erickson, David Held

模仿学习操作感知机器人学习导航灵巧手

ArticuBot 不是在发明新的 articulated manipulation 理论，而是在用大规模仿真蒸馏和几何锚定的层级表示，把“开门”这类局部接触任务推到更强的跨对象、跨本体 zero-shot 泛化边界。

PDF AlphaXiv Project

DemoGen: Synthetic Demonstration Generation for Data-Efficient Visuomotor Policy Learning figure

RSS2025Paper 157

DemoGen: Synthetic Demonstration Generation for Data-Efficient Visuomotor Policy Learning

Zhengrong Xue, Shuying Deng, Zhenyang Chen, Yixuan Wang, Zhecheng Yuan, Huazhe Xu

数据模仿学习感知生成模型灵巧手机器人学习

DemoGen 不是在提升 policy 本身，而是在用 3D 几何一致的纯合成示范，把 visuomotor 学习从“靠人工反复铺样本”推进到“靠空间覆盖驱动的 one-shot 数据扩增”。

IMLE Policy: Fast and Sample Efficient Visuomotor Policy Learning via Implicit Maximum Likelihood Estimation figure

RSS2025Paper 158

IMLE Policy: Fast and Sample Efficient Visuomotor Policy Learning via Implicit Maximum Likelihood Estimation

Krishan Rana, Robert Lee, David Pershouse, Niko Suenderhauf

数据生成模型机器人学习模仿学习扩散策略安全

IMLE Policy 本质上是把行为克隆从扩散式的迭代采样，改造成基于 IMLE 的条件集合覆盖学习，用更强的多模态归纳偏置换取少样本可用性和单步推理速度。

PDF AlphaXiv Project

Dynamic Rank Adjustment in Diffusion Policies for Efficient and Flexible Training figure

RSS2025Paper 159

Dynamic Rank Adjustment in Diffusion Policies for Efficient and Flexible Training

Xiatao Sun, Shuo Yang, Yinxing Chen, Francis Fan, Yiyan (Edgar) Liang, Daniel Rakita

机器人学习扩散策略模仿学习生成模型

这篇论文把 diffusion policy 的训练从固定 full-rank 优化，改造成一种可随阶段退火的动态低秩训练框架，核心贡献是让从头训练的机器人交互式模仿学习在算力上变得可落地。

PDF AlphaXiv Project

Gripper Pose and Object Pointflow as Interfaces for Robotic Bimanual Manipulation figure

RSS2025Paper 160

Gripper Pose and Object Pointflow as Interfaces for Robotic Bimanual Manipulation

Yuyin Yang, Zetao Cai, Yang Tian, Jia Zeng, Jiangmiao Pang

机器人学习灵巧手操作感知SLAM/定位安全

PPI 把双臂操作从“直接学连续动作”改成“先学 keypose / pointflow 这类几何接口，再在其约束下生成动作”，本质上是在用更强的空间归纳偏置修复连续策略的感知短板。

SKIL: Semantic Keypoint Imitation Learning for Generalizable Data-efficient Manipulation figure

RSS2025Paper 161

SKIL: Semantic Keypoint Imitation Learning for Generalizable Data-efficient Manipulation

Shengjie Wang, Jiacheng You, Yihang Hu, Jiongye Li, Yang Gao

模仿学习数据操作感知机器人学习基础模型

SKIL 的位置是：用视觉基础模型把模仿学习从像素级端到端控制，改造成语义关键点驱动的稀疏条件生成，从而在少样本真实操作里换来更强的泛化与数据效率，但其上限仍受制于关键点表征能否完整覆盖任务状态。

PDF AlphaXiv Project

Diffeomorphic Obstacle Avoidance for Contractive Dynamical Systems via Implicit Representations figure

RSS2025Paper 162

Diffeomorphic Obstacle Avoidance for Contractive Dynamical Systems via Implicit Representations

Ken-Joel Simmoteit, Philipp Schillinger, Leonel Rozo

机器人学习控制安全模仿学习数据

这是一篇把全身避障做成 SDF 驱动的 diffeomorphic flow 变形、并试图在 contractive skill 上保住稳定结构的工作，本质上是稳定动力系统学习与几何安全控制的结合，而不是新的轨迹规划器。

Learning Interpretable Features from Interventions figure

RSS2025Paper 163

Learning Interpretable Features from Interventions

Erin Hedlund-Botti, Julianna Schalkwyk, Nina Marie Moorman, Chuxuan Yang, Lakshmi Seelam, Sanne Van Waveren, Russell Perkins, Paul Robinette, Matthew Craig Gombolay

机器人学习可解释性操作模仿学习

这篇工作把个性化 LfD 从“学会模仿用户示范”推进到“从用户干预中提取可解释失败语义并据此分流纠错”，本质上是一次面向偏好对齐的局部化、语义化 intervention learning。