Depois de um período de testes, a Google anunciou que os modelos de inteligência artificial Gemini 2.5 Pro e Gemini 2.5 Flash estão agora prontos para serem usados em ambientes de produção empresarial. A empresa lançou uma nova variante, o Gemini 2.5 Flash-Lite, que diz ser a opção mais económica da gama para tarefas de grande volume.
De acordo com o site VentureBeat, os modelos Gemini 2.5 têm capacidades de “raciocínio”, o que permitirá aos programadores controlarem o esforço computacional que o modelo dedica a problemas complexos. Este “orçamento de pensamento” significa que as empresas podem ajustar a IA para precisão ou velocidade, dependendo da tarefa.
O Gemini 2.5 Pro é considerado o modelo mais capaz da Google. Consegue processar até um milhão de tokens de contexto, o que corresponde a cerca de 750.000 palavras. Isto permite-lhe analisar grandes quantidades de código ou documentos extensos numa única sessão. O Gemini 2.5 Flash destina-se a tarefas de elevada produção, como a elaboração de sumários de documentos e aplicações de chat, enquanto o Flash-Lite foca-se na velocidade e volume para tarefas como classificação e tradução.
A Google também alterou a sua estrutura de preços. A empresa aumentou os preços dos tokens de entrada para o Gemini 2.5 Flash, mas reduziu os custos dos tokens de saída, o que é benéfico para respostas extensas.
Adicionalmente, a distinção anterior entre preços de “pensamento” e “não-pensamento” foi eliminada, tornando a previsão de custos muito mais fácil. O Flash-Lite tem um preço de $0,10 por milhão de tokens de entrada e $0,40 por milhão de tokens de saída.