Awesome Robotics Manipulation · full_paper

World2Act: Latent Action Post-Training via Skill-Compositional World Models

作者：An Dinh Vuong, Tuan Van Vo, Abdullah Sohail, Haoran Ding, Liang Ma Xiaodan Liang, Anqing Duan, Ivan Laptev, Ian Reid MBZUAI, UAE an.vuong@mbzuai.ac.ae · 单位：pseudo label/reward · 会议/期刊：arXiv · 日期：2026-03-11 · 来源：Low-Level Learning-Based Action Modelling / Input Modelling / 2D Vision Language Action Models with Auxiliary Tasks - World Model & Visual Prediction / Visual/State Prediction/Generation

辅助任务视觉语言动作潜变量学习世界模型感知机器人学习

World2Act: Latent Action Post-Training via Skill-Compositional World Models figure — AlphaXiv 中文论文页面（可滚动查看）