Awesome Robotics Manipulation · full_paper

LaMP: Learning Vision-Language-Action Policies with 3D Scene Flow as Latent Motion Prior

作者：Xinkai Wang, Chenyi Wang, Yifu Xu, Mingzhe Ye, Fucheng Zhang, Jialin Tian, Xinyu Zhan, Lifeng Zhu, Cewu Lu, Lixin Yang, the fried egg on top” Performance · 单位：Southeast University. School of Artificial Intelligence, Shanghai Jiao · 会议/期刊：arXiv · 日期：2026-03-26 · 来源：Low-Level Learning-Based Action Modelling / Input Modelling / 2D Vision Language Action Models with Auxiliary Tasks - Visual Goal Extraction

三维表征辅助任务视觉语言动作潜变量学习感知机器人学习

LaMP: Learning Vision-Language-Action Policies with 3D Scene Flow as Latent Motion Prior figure — AlphaXiv 中文论文页面（可滚动查看）