RESEARCH28

Co-Evolving LLM Decision and Skill Bank Agents for Long-Horizon Tasks

arXiv CS.AI·25 de abril de 2026

Este artigo apresenta o COSPLAY, um framework de co-evolução que melhora a tomada de decisão de LLMs em tarefas de longo prazo. Ele permite que um agente LLM recupere habilidades de um banco de habilidades aprendível enquanto um pipeline de agente descobre e retém novas habilidades de suas próprias interações não rotuladas.

LLMsreinforcement-learningSkill DiscoveryAI agents

Ler original ↗