Awesome Robotics Manipulation · full_paper

DepthVLA: Enhancing Vision-Language-Action Models with Depth-Aware Spatial Reasoning

作者：Tianyuan Yuan, Yicheng Liu, Chenhao Lu, Zhuoguang Chen, Tao Jiang, Hang Zhao · 单位：IIIS, Tsinghua University · 会议/期刊：arXiv · 日期：2025-10-15 · 来源：Low-Level Learning-Based Action Modelling / Input Modelling / 3D Vision Language Action Models

三维表征视觉语言动作机器人学习

DepthVLA: Enhancing Vision-Language-Action Models with Depth-Aware Spatial Reasoning figure — AlphaXiv 中文论文页面（可滚动查看）