A Google revelou o Gemini 3.1 Flash-Lite, focado na velocidade e custo reduzido.
Depois do Gemini 2.5 Flash-Lite é agora a vez de chegar o mais poderoso Gemini 3.1 Flash-Lite. Mantendo o foco na velocidade e eficiência de custos, este modelo foi criado para tarefas de grande volume e está disponível em preview para developers através da Gemini API no Google AI Studio e também para empresas via Vertex AI.
Segundo a Google, o Gemini 3.1 Flash-Lite foi criado para oferecer bom desempenho com custos muito reduzidos. O modelo custa cerca de 0.25 dólares por milhão de tokens de entrada e 1.50 dólares por milhão de tokens de saída. Além disso, apresenta melhorias de velocidade significativas face ao Gemini 2.5 Flash, incluindo até 2.5 vezes menos tempo até à primeira resposta e cerca de 45% mais rapidez na geração de conteúdo.
Apesar de ser um modelo mais leve, os testes indicam resultados competitivos. O Gemini 3.1 Flash-Lite alcançou um score Elo de 1432 no Arena.ai Leaderboard e apresentou bons resultados em benchmarks de raciocínio e compreensão multimodal, incluindo 86,9% no teste GPQA Diamond e 76,8% no MMMU Pro.
Outra característica importante é o controlo do nível de "thinking", disponível no AI Studio e no Vertex AI. Isto permite aos developers ajustar a capacidade de raciocínio que o modelo utiliza em cada tarefa, em função do desempenho e custo pretendido.
Ainda assim, o preço competitivo que a Google refere representa um aumento substancial face ao Gemini 2.5 Flash-Lite ($0.10/$0.40 para $25/$1.50), algo que é considerado justo por alguns - tendo em conta a melhoria das capacidades - mas que é criticado por outros.
Subscrever:
Enviar feedback (Atom)




















Sem comentários:
Enviar um comentário (problemas a comentar?)