heapsort-ai
NEWS26

GPT-5.5 Tops Benchmarks, Costs 2x API Price, Still Hallucinates

DEV.to AI·25 de abril de 2026

A OpenAI lançou o GPT-5.5, um modelo agente que lidera benchmarks em codificação e matemática, superando concorrentes. Contudo, testes independentes mostram maiores taxas de alucinação e custos efetivos de API mais altos.

hallucinationBenchmarkingagentic AIAI modelpricing
Ler original