Awesome Robotics Manipulation · full_paper

AnySlot: Goal-Conditioned Vision-Language-Action Policies for Zero-Shot Slot-Level Placement

作者：Zhaofeng Hu, Sifan Zhou, Qinbo Zhang, Rongtao Xu, Qi Su, Ci-Jyun Liang · 单位：Stony Brook University, Stony Brook, USA, Carnegie Mellon University, Pittsburgh, USA, Mohamed Bin Zayed University of Artificial Intelligence, Abu Dhabi, UAE, Peking University, Beijing, China · 会议/期刊：arXiv · 日期：2026-04-12 · 来源：Low-Level Learning-Based Action Modelling / Input Modelling / 2D Vision Language Action Models with Auxiliary Tasks - World Model & Visual Prediction / Visual/State Prediction/Generation

辅助任务视觉语言动作世界模型感知机器人学习

AnySlot: Goal-Conditioned Vision-Language-Action Policies for Zero-Shot Slot-Level Placement figure — AlphaXiv 中文论文页面（可滚动查看）