主页 ← Embodied AI TopConf Index

Embodied AI TopConf · ICCV2025

Dita: Scaling Diffusion Transformer for Generalist Vision-Language-Action Policy

ICCV2025 / Vision-Language-Action Model

视觉语言动作策略学习感知

Dita: Scaling Diffusion Transformer for Generalist Vision-Language-Action Policy figure — AlphaXiv 中文论文页面（可滚动查看）

论文对话

模型：读取中