notch
RESEARCH27

Rethinking Token Prediction: Tree-Structured Diffusion Language Model

arXiv CS.CL·7 de abril de 2026

Este trabalho propõe um modelo de linguagem de difusão com estrutura de árvore para otimizar o treinamento e reduzir o uso de parâmetros e memória em modelos de difusão discretos. Ele substitui a previsão de vocabulário completo pela exploração da estrutura inerente dos tokens através de uma árvore de vocabulário pré-construída, utilizando estados latentes intermediários.

previsão de tokensárvore de vocabuláriodifusão discretaarquitetura de IAmodelos de linguagemotimização de parâmetros
Ler original