RESEARCH27
Rethinking Token Prediction: Tree-Structured Diffusion Language Model
arXiv CS.CL·7 de abril de 2026
Este trabalho propõe um modelo de linguagem de difusão com estrutura de árvore para otimizar o treinamento e reduzir o uso de parâmetros e memória em modelos de difusão discretos. Ele substitui a previsão de vocabulário completo pela exploração da estrutura inerente dos tokens através de uma árvore de vocabulário pré-construída, utilizando estados latentes intermediários.
previsão de tokensárvore de vocabuláriodifusão discretaarquitetura de IAmodelos de linguagemotimização de parâmetros
Ler original ↗