Awesome Robotics Manipulation · full_paper

Vlaser: Vision-Language-Action Model with Synergistic Embodied Reasoning

作者：Ganlin Yang, Tianyi Zhang, Haoran Hao, Weiyun Wang, Yibin Liu, Dehui Wang, Guanzhou Chen, Zijian Cai, Junting Chen, Weijie Su, Wengang Zhou, Yu Qiao, Jifeng Dai, Jiangmiao Pang, Gen Luo, Wenhai Wang, Yao Mu, Zhi Hou · 单位：University of Science and Technology of China, Shanghai AI Laboratory, Shanghai Jiao Tong University, Zhejiang University, Nanjing University, Fudan University, Tsinghua University, Northeastern University, Shenzhen University · 会议/期刊：ICLR 2026 · 日期：2025-10-13 · 来源：Low-Level Learning-Based Action Modelling / Input Modelling / 2D Vision Language Action Models with Auxiliary Tasks - Text Goal Extraction

辅助任务视觉语言动作机器人学习

Vlaser: Vision-Language-Action Model with Synergistic Embodied Reasoning figure — AlphaXiv 中文论文页面（可滚动查看）