RESEARCH0

Mitigating LLM biases toward spurious social contexts using direct preference optimization

arXiv CS.AI·6 de abril de 2026

O conteúdo aborda a mitigação de vieses em Grandes Modelos de Linguagem (LLMs) que surgem em contextos sociais enganosos. Para isso, é utilizada a otimização por preferência direta como método.

LLMsAI biasethical-AIDirect Preference Optimization

Ler original ↗