RESEARCH27

Hierarchical Policy Optimization for Simultaneous Translation of Unbounded Speech

arXiv CS.CL·24 de abril de 2026

Este trabalho propõe a Otimização Hierárquica de Políticas (HPO) para Tradução Simultânea de Fala (SST) utilizando LLMs, abordando desafios como alto custo computacional e dados imperfeitos. O HPO emprega uma recompensa hierárquica para equilibrar qualidade de tradução e latência, mostrando melhorias substanciais em pontuações COMET e MetricX.

LLMsmachine learningNatural Language Processingspeech-translation

Ler original ↗