ARTICLE49

LLM Drift: Why Your AI Detection Pipeline is Quietly Decaying (Kimi K2 Benchmark)

DEV.to AI·27 de abril de 2026

Este relatório de campo expõe a decadência silenciosa dos pipelines de detecção de IA, mostrando que detectores populares como ZeroGPT falham contra saídas de LLM modernas, errando 62% do conteúdo de IA em um benchmark Kimi K2. O estudo também destaca altas taxas de falsos positivos, como classificar a Declaração de Independência dos EUA como 99% gerada por IA, invalidando sua confiabilidade.

AI detectionbenchmarkingLLM

Ler original ↗