Awesome Robotics Manipulation · full_paper

StereoVLA: Enhancing Vision-Language-Action Models with Stereo Vision

作者：Shengliang Deng, Mi Yan, Yixin Zheng, Jiayi Su, Wenhao Zhang, Xiaoguang Zhao, Heming Cui, Zhizheng Zhang, He Wang · 单位：Galbot Peking University The University of Hong Kong Institute of · 会议/期刊：arXiv · 日期：2025-12-26 · 来源：Low-Level Learning-Based Action Modelling / Input Modelling / 3D Vision Language Action Models

三维表征视觉语言动作机器人学习

StereoVLA: Enhancing Vision-Language-Action Models with Stereo Vision figure — AlphaXiv 中文论文页面（可滚动查看）