notch
RESEARCH27

Vocabulary Dropout for Curriculum Diversity in LLM Co-Evolution

arXiv CS.CL·7 de abril de 2026

A pesquisa aborda a queda de diversidade em sistemas de co-evolução de LLMs, onde um modelo gera problemas e outro os resolve, comprometendo o aprendizado de currículo autônomo. Para resolver isso, introduz o 'vocabulary dropout', uma máscara aleatória para manter a diversidade, resultando em melhorias no desempenho de solvers em raciocínio matemático.

mathematical reasoningDiversityCo-evolutionself-playCurriculum LearningLLM
Ler original