主页 ← Embodied AI TopConf Index

Embodied AI TopConf · ICLR2026

PixelVLA: Advancing Pixel-level Understanding in Vision-Language-Action Model

ICLR2026 / Vision-Language-Action Models

视觉语言动作感知

PixelVLA: Advancing Pixel-level Understanding in Vision-Language-Action Model figure — AlphaXiv 中文论文页面（可滚动查看）

论文对话

模型：读取中