Awesome Robotics Manipulation · full_paper

Self-Refining Vision Language Model for Robotic Failure Detection and Reasoning

作者：Carl Qi, Xiaojie Wang, Silong Yong, Stephen Sheng, Huitan Mao, Sriram Srinivasan, Manikantan Nambi, Amy Zhang, Yesh Dattatreya UT Austin · 单位：Amazon Robotics, Carnegie Mellon University · 会议/期刊：ICLR 2026 · 日期：2026-02-12 · 来源：High-Level Structured Planning / Multimodal Reasoning / Failure Reasoning

任务规划多模态推理感知操作

Self-Refining Vision Language Model for Robotic Failure Detection and Reasoning figure — AlphaXiv 中文论文页面（可滚动查看）