Awesome Robotics Manipulation · full_paper

RynnVLA-002: A Unified Vision-Language-Action and World Model

作者：Jun Cen, Siteng Huang, Yuqian Yuan, Kehan Li, Hangjie Yuan, Chaohui Yu, Yuming Jiang, Jiayan Guo, Xin Li, Hao Luo, Fan Wang, Deli Zhao, Hao Chen · 单位：DAMO Academy, Alibaba Group Hupan Lab Zhejiang University · 会议/期刊：arXiv · 日期：2025-11-21 · 来源：Low-Level Learning-Based Action Modelling / Input Modelling / 2D Vision Language Action Models with Auxiliary Tasks - World Model & Visual Prediction / World Model

辅助任务视觉语言动作世界模型感知机器人学习

RynnVLA-002: A Unified Vision-Language-Action and World Model figure — AlphaXiv 中文论文页面（可滚动查看）