ARTICLE49
LLM Drift: Why Your AI Detection Pipeline is Quietly Decaying (Kimi K2 Benchmark)
DEV.to AI·27 de abril de 2026
Este relatório de campo expõe a decadência silenciosa dos pipelines de detecção de IA, mostrando que detectores populares como ZeroGPT falham contra saídas de LLM modernas, errando 62% do conteúdo de IA em um benchmark Kimi K2. O estudo também destaca altas taxas de falsos positivos, como classificar a Declaração de Independência dos EUA como 99% gerada por IA, invalidando sua confiabilidade.
AI detectionbenchmarkingLLM
Ler original ↗