Awesome Robotics Manipulation · full_paper

Continuous Vision-Language-Action Co-Learning with Semantic-Physical Alignment for Behavioral Cloning

作者：Xiuxiu Qi, Yu Yang, Jiannong Cao, Luyao Bai, Chongshan Fan, Chengtai Cao, Hongpeng Wang · 单位：The College of Artificial Intelligence & Shenzhen Research Institute, Nankai University, Tianjin, China, Department of Computing, The Hong Kong Polytechnic University, Hong Kong SAR, China, Centre for Learning, Teaching and Technology, The Education University of Hong Kong, Hong Kong SAR, China, Department of Computer Science, City University of Hong Kong, Hong Kong SAR, China · 会议/期刊：AAAI 2026 · 日期：2025-11-18 · 来源：Low-Level Learning-Based Action Modelling / Input Modelling / 2D Non-LLM-based Vision Language Action Models

视觉语言动作语言条件机器人学习

Continuous Vision-Language-Action Co-Learning with Semantic-Physical Alignment for Behavioral Cloning figure — AlphaXiv 中文论文页面（可滚动查看）