Num mundo em que a evolução da IA está a acelerar cada vez mais, a startup chinesa DeepSeek chamou uma vez mais a atenção com o lançamento, mais ou menos discreto do seu modelo v3.1, que agora pode ser visto como um sério concorrente aos mais recentes avanços nesta área vindos dos Estados Unidos. Lançado duas semanas após a estreia do GPT-5 da OpenAI, o v3.1 da DeepSeek capturou o interesse de especialistas em IA devido ao seu desempenho nos benchmarks essenciais, à sua política de preços estratégica e ao seu design, que foi optimizado para operar independentemente da tecnologia americana.
A DeepSeek anunciou o modelo v3.1 através de uma mensagem no WeChat, a plataforma social mais utilizada na China, e no site da comunidade Hugging Face. O novo modelo possui 685 mil milhões de parâmetros, colocando-o no campeonato dos maiores sistemas de IA do mundo.
Ao contrário de muitos concorrentes, a DeepSeek usa um design de “mistura de especialistas” (“mixture-of-experts”), activando apenas as partes necessárias do modelo para cada consulta. Isso traduz-se em custos computacionais reduzidos, uma característica atraente para quem procura tanto poder como eficiência na implementação de IA.
Além disso, o v3.1 funde capacidades de resposta rápida com raciocínio avançado, um passo técnico em frente que o torna mais versátil do que muitas alternativas de peso aberto (“open-weight”). Ben Dickson, analista de tecnologia e fundador da TechTalks, disse à revista Fortune que a arquitectura híbrida é “de longe a maior característica”, distinguindo-o de iterações anteriores e de outros modelos de código aberto.
O ímpeto da DeepSeek não passou despercebido em Washington. Na semana passada, o governo dos EUA concedeu à Nvidia e à AMD licenças restritas para exportar chips de IA modificados para a China, mas impôs uma taxa exigindo que 15 por cento das receitas dessas vendas fossem pagas ao Tesouro dos EUA. Pequim respondeu limitando as compras de chips da Nvidia.
Embora os modelos da DeepSeek ainda não tenham alcançado uma adopção generalizada entre as empresas americanas, ganharam uma tracção significativa na China e estão a ser cada vez mais adoptados globalmente. Alguns programadores nos EUA começaram a construir aplicações no modelo anterior da DeepSeek, R1, apesar das preocupações de que a IA de fabrico chinês possa disseminar mensagens aprovadas pelo governo chinês.
Especialistas notam que, embora o último lançamento da DeepSeek possa não representar o mesmo salto em frente que o do modelo R1 no início deste ano, no entanto, oferece avanços significativos.
William Falcon, fundador e CEO da plataforma de programadores de IA Lightning AI, descreveu o progresso constante da DeepSeek como “muito impressionante”, apontando para o potencial desafio que representa para a OpenAI, caso as suas próprias ofertas de código aberto não consigam acompanhar o ritmo.
A DeepSeek não está sozinha na corrida pela IA na China. Outros grandes intervenientes incluem a Alibaba com o seu modelo Qwen, o Kimi da Moonshot AI e o Ernie da Baidu. O momento do lançamento do v3.1, tão perto da revelação do GPT-5 – que muitos observadores dizem ter ficado aquém das expectativas – sublinha a determinação de Pequim em manter e potencialmente superar a paridade com a inovação dos EUA.
As afirmações audaciosas da DeepSeek sublinham tanto a promessa como a incerteza da corrida pela IA de hoje. Embora a eficiência e a relação custo-benefício do modelo possam pressionar os rivais dos EUA a mover-se mais rapidamente, o quadro geral é mais complicado.
Analistas alertam que as expectativas crescentes em torno da IA generativa podem estar a alimentar uma bolha, com muitas empresas ainda a não verem retornos tangíveis. Um estudo do MIT descobriu recentemente que 95% das implementações de IA não conseguem aumentar os lucros, destacando uma incompatibilidade entre o hype e o impacto. Nomeadamente, a pesquisa sugere que o maior valor reside não em ferramentas de interface (“front-end”) chamativas, mas na automação de “back-end” que simplifica as operações e reduz custos.
Com os investimentos em “big tech” e em IA a desempenhar um papel desproporcionado no mercado de acções de hoje, muitos estão a começar a questionar onde estão os retornos. Apesar de todas as manchetes sobre modelos de ponta, o futuro da liderança em IA pode depender menos de lançamentos chamativos e mais de entregar resultados de negócios reais e mensuráveis.