Awesome Robotics Manipulation · full_paper

Vision-Language Models Unlock Task-Centric Latent Actions

作者：Alexander Nikulin Ilya Zisman Albina Klepach, Denis Tarasov Alexander Derevyagin, Andrei Polubarov Lyubaykin Nikita Vladislav Kurenkov · 单位：Research Center for Trusted Artificial Intelligence, ISP RAS · 会议/期刊：arXiv · 日期：2026-01-30 · 来源：Low-Level Learning-Based Action Modelling / Input Modelling / 2D Vision Language Action Models with Latent Learning

视觉语言动作潜变量学习机器人学习

Vision-Language Models Unlock Task-Centric Latent Actions figure — AlphaXiv 中文论文页面（可滚动查看）