Awesome Robotics Manipulation · full_paper

MoTVLA: A Vision-Language-Action Model with Unified Fast-Slow Reasoning

作者：Wenhui Huang Changhe Chen Han Qi, Chen Lv, Yilun Du, Heng Yang · 单位：Harvard University, University of Michigan, Nanyang Technological University · 会议/期刊：arXiv · 日期：2025-10-21 · 来源：Low-Level Learning-Based Action Modelling / Input Modelling / 2D Non-LLM-based Vision Language Action Models

视觉语言动作语言条件机器人学习

MoTVLA: A Vision-Language-Action Model with Unified Fast-Slow Reasoning figure — AlphaXiv 中文论文页面（可滚动查看）