Awesome Robotics Manipulation · full_paper

Drift-Based Policy Optimization: Native One-Step Policy Learning for Online Robot Control

作者：Yuxuan Gao, Yedong Shen, Shiqi Zhang, Wenhao Yu, Yifan Duan, Jia Pan, Jiajia Wu, Jiajun Deng, Yanyong Zhang, Fellow · 单位：University · 会议/期刊：arXiv · 日期：2026-04-04 · 来源：Low-Level Learning-Based Action Modelling / Policy Learning / Other Policies / Drift-based Policy

机器人学习

Drift-Based Policy Optimization: Native One-Step Policy Learning for Online Robot Control figure — AlphaXiv 中文论文页面（可滚动查看）