RESEARCH27

Prism: Policy Reuse via Interpretable Strategy Mapping in Reinforcement Learning

arXiv CS.LG·6 de abril de 2026

O artigo apresenta PRISM, uma estrutura para Reinforcement Learning que fundamenta as decisões de agentes em conceitos discretos e causalmente validados, usando-os como interface de transferência zero-shot. Ele demonstra que esses conceitos impulsionam diretamente o comportamento do agente e que a importância de um conceito pode ser dissociada de sua frequência de uso.

Strategy MappingReinforcement Learningtransfer learninginterpretabilitycausal-inferencePolicy Reuse

Ler original ↗