主页 ← Embodied AI TopConf Index

Embodied AI TopConf · ICML2025

OTTER: A Vision-Language-Action Model with Text-Aware Visual Feature Extraction

ICML2025 / Vision-Language-Action Models

视觉语言动作感知

OTTER: A Vision-Language-Action Model with Text-Aware Visual Feature Extraction figure — AlphaXiv 中文论文页面（可滚动查看）

论文对话

模型：读取中