NEWS21
New ways to balance cost and reliability in the Gemini API
Google AI Blog·2 de abril de 2026
Google está introduzindo dois novos níveis de inferência, Flex e Priority, para a API Gemini. O objetivo é equilibrar o custo e a latência no uso da API.
Google AIOtimização de CustosAPI tiersinferêncialatênciaGemini API
Ler original ↗