RESEARCH0
Mitigating LLM biases toward spurious social contexts using direct preference optimization
arXiv CS.AI·6 de abril de 2026
O conteúdo aborda a mitigação de vieses em Grandes Modelos de Linguagem (LLMs) que surgem em contextos sociais enganosos. Para isso, é utilizada a otimização por preferência direta como método.
LLMsAI biasethical-AIDirect Preference Optimization
Ler original ↗