RESEARCH28
Co-Evolving LLM Decision and Skill Bank Agents for Long-Horizon Tasks
arXiv CS.AI·25 de abril de 2026
Este artigo apresenta o COSPLAY, um framework de co-evolução que melhora a tomada de decisão de LLMs em tarefas de longo prazo. Ele permite que um agente LLM recupere habilidades de um banco de habilidades aprendível enquanto um pipeline de agente descobre e retém novas habilidades de suas próprias interações não rotuladas.
LLMsreinforcement-learningSkill DiscoveryAI agents
Ler original ↗