Awesome Robotics Manipulation · full_paper

Seeing Across Views: Benchmarking Spatial Reasoning of Vision-Language Models in Robotic Scenes

作者：Zhiyuan Feng, Zhaolu Kang, Qijie Wang, Zhiying Du, Jiongrui Yan, Shubin Shi, Chengbo Yuan, Huizhi Liang, Yu Deng, Qixiu Li, Rushuai Yang, Arctanx An, Leqi Zheng, Weijie Wang, Shawn Chen, Sicheng Xu, Yaobo Liang, Jiaolong Yang, Baining Guo · 单位：Tsinghua University, Peking University, Fudan University, Microsoft Research Asia, Hong Kong University of Science and Technology, Zhejiang University · 会议/期刊：arXiv · 日期：2025-10-22 · 来源：README / 📊 Awesome Simulators, Benchmarks and Dataset / Embodied QA and Affordance Datasets

可供性操作数据集/基准

Seeing Across Views: Benchmarking Spatial Reasoning of Vision-Language Models in Robotic Scenes figure — AlphaXiv 中文论文页面（可滚动查看）