Awesome Robotics Manipulation · full_paper

Dual-Stream Diffusion for World-Model Augmented Vision-Language-Action Model

作者：John Won, Kyungmin Lee, Huiwon Jang, Dongyoung Kim, Jinwoo Shin · 单位：KAIST · 会议/期刊：arXiv · 日期：2025-10-31 · 来源：Low-Level Learning-Based Action Modelling / Input Modelling / 2D Vision Language Action Models with Auxiliary Tasks - World Model & Visual Prediction / World Model

辅助任务视觉语言动作扩散策略数据增强世界模型感知机器人学习

Dual-Stream Diffusion for World-Model Augmented Vision-Language-Action Model figure — AlphaXiv 中文论文页面（可滚动查看）