A empresa chinesa DeepSeek lançou recentemente o seu novo modelo fundacional, o DeepSeek v4. Esta novidade promete abalar o domínio das principais empresas de inteligência artificial dos Estados Unidos, ao oferecer um desempenho de topo a uma fracção do preço. O novo modelo de pesos abertos chega para competir directamente com as propostas da Anthropic, OpenAI e Google.
Duas versões optimizadas para diferentes necessidades
O DeepSeek v4 está disponível em duas variantes distintas. A primeira é a versão Pro, que integra 1,6 biliões de parâmetros, dos quais 49 mil milhões estão activos. A segunda opção é a versão Flash, que oferece 248 mil milhões de parâmetros, com 13 mil milhões activos. Ambas as versões utilizam uma arquitectura Mixture-of-Experts (MoE), o que significa que apenas uma fracção dos parâmetros é activada durante cada inferência. Esta abordagem permite reduzir drasticamente o custo computacional necessário para executar tarefas complexas.
Além disso, o modelo foi significativamente melhorado no que diz respeito à janela de contexto, que agora suporta até um milhão de tokens. Esta capacidade permite aos utilizadores introduzir volumes massivos de texto de uma só vez, um salto notável face aos 128 mil tokens da versão anterior. A eficiência também foi optimizada, uma vez que o v4 requer apenas 27% das operações por token e 10% da cache KV em comparação com o DeepSeek v3.2.
Desempenho a preços muito agressivos
Os testes internos da empresa mostram que a versão v4 Pro-Max consegue igualar ou superar modelos de referência como o Claude Opus 4.6 Max, o GPT-5.4 xHigh e o Gemini 3.1 Pro High. Numa prova de programação específica, o modelo chinês alcançou uma pontuação de 93,5%, enquanto o Opus 4.6 se ficou pelos 88,8%.
No entanto, o maior atractivo desta nova inteligência artificial reside nos seus custos de utilização. Os preços oficiais do DeepSeek v4 Pro fixam-se em 1,74 dólares por milhão de tokens de entrada e 3,48 dólares por milhão de tokens de saída. Estes valores são quase sete vezes inferiores aos praticados pelo Opus 4.7 e até nove vezes mais baixos que os do novo GPT-5.5. A versão Flash é ainda mais acessível, a custar apenas 0,14 e 0,28 dólares para entrada e saída, respectivamente. Esta estratégia agressiva dá continuidade à tendência observada quando a versão anterior começou a pressionar as empresas de inteligência artificial norte-americanas.
O mistério do hardware e o impacto no mercado
A DeepSeek não revelou qual o hardware utilizado para treinar este novo modelo, mas sabe-se que o software foi desenvolvido para funcionar tanto em processadores da NVIDIA como nos chips Ascend da Huawei. A compatibilidade com a tecnologia da Huawei é vista como um rude golpe para os Estados Unidos, pois indica que a dependência chinesa face aos componentes da NVIDIA está a diminuir. Um artigo do The Information refere que a necessidade de adaptar o modelo aos chips da Huawei foi um dos motivos para o ligeiro atraso no lançamento.
Apesar do sucesso técnico, a empresa atravessa um período de transição interna. Elementos-chave da equipa de desenvolvimento abandonaram recentemente a estrutura para se juntarem à ByteDance e à Xiaomi. Em simultâneo, o The Wall Street Journal indica que a DeepSeek procura levantar cerca de 300 milhões de dólares em financiamento externo, o que poderá elevar a avaliação da empresa para os 20 mil milhões de dólares.
Para a concorrência, em especial para a Anthropic, a chegada do DeepSeek v4 representa um desafio enorme. A empresa norte-americana viu-se recentemente obrigada a ajustar os seus modelos, que agora consomem mais tokens. Se a experiência real dos utilizadores confirmar os resultados dos testes preliminares, o mercado global de inteligência artificial poderá sofrer uma alteração profunda nos próximos meses.