主页 ← Embodied AI TopConf Index

Embodied AI TopConf · ICLR2026

Policy Likelihood-based Query Sampling and Critic-Exploited Reset for Efficient Preference-based Reinforcement Learning

ICLR2026 / Policy

策略学习触觉加速/部署

Policy Likelihood-based Query Sampling and Critic-Exploited Reset for Efficient Preference-based Reinforcement Learning figure — 在线论文 PDF（可滚动查看）

论文对话

模型：读取中