NEWS21

New ways to balance cost and reliability in the Gemini API

Google AI Blog·2 de abril de 2026

Google está introduzindo dois novos níveis de inferência, Flex e Priority, para a API Gemini. O objetivo é equilibrar o custo e a latência no uso da API.

Google AIOtimização de CustosAPI tiersinferêncialatênciaGemini API

Ler original ↗