RESEARCH27
Hierarchical Policy Optimization for Simultaneous Translation of Unbounded Speech
arXiv CS.CL·24 de abril de 2026
Este trabalho propõe a Otimização Hierárquica de Políticas (HPO) para Tradução Simultânea de Fala (SST) utilizando LLMs, abordando desafios como alto custo computacional e dados imperfeitos. O HPO emprega uma recompensa hierárquica para equilibrar qualidade de tradução e latência, mostrando melhorias substanciais em pontuações COMET e MetricX.
LLMsmachine learningNatural Language Processingspeech-translation
Ler original ↗