RESEARCH27
Prism: Policy Reuse via Interpretable Strategy Mapping in Reinforcement Learning
arXiv CS.LG·6 de abril de 2026
O artigo apresenta PRISM, uma estrutura para Reinforcement Learning que fundamenta as decisões de agentes em conceitos discretos e causalmente validados, usando-os como interface de transferência zero-shot. Ele demonstra que esses conceitos impulsionam diretamente o comportamento do agente e que a importância de um conceito pode ser dissociada de sua frequência de uso.
Strategy MappingReinforcement Learningtransfer learninginterpretabilitycausal-inferencePolicy Reuse
Ler original ↗