Awesome Robotics Manipulation · full_paper

KineVLA: Towards Kinematics-Aware Vision-Language-Action Models with Bi-Level Action Decomposition

作者：Gaoge Han, Zhengqing Gao, Ziwen Li, Jiaxin Huang, Shaoli Huang, Fakhri Karray, Mingming Gong, Tongliang Liu · 会议/期刊：arXiv · 日期：2026-03-18 · 来源：Low-Level Learning-Based Action Modelling / Input Modelling / 2D Vision Language Action Models with Auxiliary Tasks - Text Goal Extraction

辅助任务视觉语言动作机器人学习

KineVLA: Towards Kinematics-Aware Vision-Language-Action Models with Bi-Level Action Decomposition figure — AlphaXiv 中文论文页面（可滚动查看）