PCGuia PCGuia
  • [email protected]
  • Dicas
    • Apps
    • Descomplicómetro
    • Download da semana
    • Guia completo
    • Inteligência Artificial
    • Linux
    • Modding
    • Photoshop
    • Teste de velocidade da Internet
    • Open Source
  • MacGuia
  • Jogos
  • Notícias
    • Ambiente
    • Apps
    • Ciência
    • Curiosidades
    • Hardware
    • Inteligência Artificial
    • Internet
    • Mercados
    • Mobilidade
    • Multimédia
    • Robots
    • Segurança
    • Software
    • Startup
    • Especiais
      • Especial PCGuia
      • História
  • Reviews
    • Armazenamento
    • Áudio
    • Componentes
    • Desktops
    • Gadgets
    • Imagem
    • Mobilidade
    • Periféricos
    • Robótica
  • Opinião
    • Conceito Humanoide
    • Há Uma App Para Tudo
    • O Que Vem à Rede
    • Praia das Maçãs
    • Quinta Coluna
  • Precisa de ajuda?
  • Contactos
  • Como testamos os produtos
  • Termos de utilização
  • Política de privacidade e cookies
  • Estatuto Editorial
  • Declaração de Privacidade
  • Política de Cookies
© 2023 - Fidemo Sociedade de Media
A ler: A DeepSeek, a startup chinesa de Inteligência Artificial, ultrapassa os gigantes de Silicon Valley com um novo modelo de IA de baixo custo
Font ResizerAa
PCGuia PCGuia
Font ResizerAa
Procurar
  • Dicas
  • Jogos
  • Linux
  • Notícias
  • Opinião
  • Reviews
  • Cookie Policy
© 2023 Fidemo Sociedade de Média
PCGuia > Notícias > Inteligência Artificial > A DeepSeek, a startup chinesa de Inteligência Artificial, ultrapassa os gigantes de Silicon Valley com um novo modelo de IA de baixo custo
Inteligência ArtificialNotícias

A DeepSeek, a startup chinesa de Inteligência Artificial, ultrapassa os gigantes de Silicon Valley com um novo modelo de IA de baixo custo

A DeepSeek consegue competir com os modelos mais recentes da OpenAI, mas funciona com hardware considerado de segunda categoria.

Pedro Tróia
Publicado em 28 de Janeiro, 2025
Tempo de leitura: 5 min
Deepseek

Os gigantes tecnológicos dos EUA acreditavam que a sua liderança no campo da Inteligência Artificial era inabalável, pelo menos a curto prazo. Hoje, estão a reavaliar essa suposição, o que pode levar a uma grande reviravolta neste ecossistema. A startup chinesa DeepSeek explodiu em popularidade com um modelo que custou quase nada para construir e que até pode superar alguns dos modelos mais avançados das empresas americanas.

- Publicidade -

A DeepSeek apareceu recentemente no radar das grandes empresas de tecnologia, quando a sua aplicação para iPhone subiu rapidamente para o topo das mais descarregadas da App Store. A aplicação e o site associado permitem o acesso ao mais recente DeepThink R1 da empresa, um modelo de raciocínio semelhante ao GPT-4 da OpenAI ou ao Gemini Flash Thinking do Google. Também oferece um modelo generativo mais tradicional chamado DeepSeek V3, mas foi o poder do R1 que o levou a destronar o ChatGPT na App Store.

Aparentemente, os modelos de IA da DeepSeek cumprem ou excedem os padrões dos modelos de código aberto mais capazes, como o Meta Llama. Até conseguem competir com os maiores modelos de código proprietário fechado, como o GPT-4 da OpenAI. Ao mesmo tempo, a DeepSeek está a trabalhar sem os benefícios do hardware mais recente e mais rápido.

Nos últimos anos, os EUA têm restringido a exportação para a China dos modelos de aceleradores de IA mais poderosos e também de equipamentos de fabrico de chips. Através da imposição de restrições de exportação, o governo americano esperava atrasar os esforços da China para usar a tecnologia de IA em aplicações militares. A Nvidia cumpriu as restrições, com a criação de versões menos poderosas das suas placas para aplicações de IA, como a H800 e, posteriormente, a H20. Esses aceleradores menos poderosos tinham o objectivo de o desenvolvimento de tecnologias de IA na China sob controlo, mas parece que essa estratégia não está a ser bem-sucedida.

De acordo com o site Axios, a DeepSeek conseguiu criar o R1 usando placas Nvidia H800 por apenas 6 milhões de dólares. A OpenAI, Google e o resto das grandes empresas de tecnologia estão a gastar centenas de milhões de dólares em cada novo modelo. Esses modelos aumentam de trimestre para trimestre, adicionando milhares de milhões de parâmetros, mas talvez essa não seja a única maneira de fazer avançar a IA generativa.

A notícia do sucesso repentino da DeepSeek causou ondas em Silicon Valley. A Nvidia, que viu a sua avaliação disparar nos últimos anos, está no meio de uma queda no valor das acções. Desde sexta-feira, o preço das acções da empresa caiu cerca de 20%, eliminando mais de 500 mil milhões de dólares em valor.

- Publicidade -

De acordo com várias notícias, embora a DeepSeek ainda esteja a usar hardware da Nvidia, o uso de aceleradores mais lentos específicos para a China sugere que as empresas podem não precisar de gastar muito nos novos componentes Blackwell da empresa. Espera-se que cada chip Blackwell custe mais de 70.000 dólares. É incerto como as empresas de IA dos EUA irão reagir, mas vão ter de fazer algo.

O que torna o DeepSeek-R1 especial em comparação com os modelos de IA concorrentes?

Como pode ter adivinhado, o R1 oferece capacidades semelhantes com o OpenAI GPT-4 em matemática, codificação e raciocínio. De acordo com um artigo publicado pela empresa de IA na semana passada, as capacidades de raciocínio surpreendentes do modelo são baseadas numa técnica apelidada ‘aprendizagem por reforço puro’. O gestor sénior de pesquisa da NVIDIA, Jim Fan, afirma que a técnica é semelhante à abordagem do Google DeepMind com o AlphaZero, que demonstrou a sua competência numa vasta gama de jogos, incluindo Go e xadrez “sem imitar primeiro os movimentos dos grandes mestres humanos”.

O que exactamente o R1 faz? A DeepSeek diz que atinge “desempenho comparável ao OpenAI GPT-4 em tarefas de matemática, geração de código e de raciocínio”.
Curiosamente, o R1 obteve uma pontuação de 79,8% no benchmark de matemática AIME 2024, superando o modelo de raciocínio GPT-4 da OpenAI. Demonstrou ainda nível especialista em testes de codificação com uma classificação Elo de 2.029 no Codeforces e superou 96,3% dos concorrentes humanos.

A aprendizagem por reforço promove comportamentos de raciocínio poderosos e interessantes, permitindo que o modelo desenvolva capacidades avançadas como autoverificação e reflexão sem treino ou programação prévios.

- Publicidade -
Etiquetas:DeepSeekGoogleNVIDIAOpenAI
Ad image
Apoio
Ad image Ad image

Também lhe pode interessar

©Dreame | H15 Pro
NotíciasRobots

Dreame “aquece” o mercado com o novo H15 Pro Heat: este aspirador lava a 55 graus

Tempo de leitura: 2 min
©Hisense | Devialet
MultimédiaNotícias

Devialet entra em força na Hisense: há televisões e um home theatre com um som “renovado”

Tempo de leitura: 1 min
©Nick Karvounis | Porto
InovaçãoNotícias

Paredes, tectos e pavimentos podem ser baterias térmicas? É o que este projecto liderado por portugueses quer demonstrar

Tempo de leitura: 3 min
NotebookLM
Inteligência ArtificialNotícias

Google acrescenta resumos em vídeo ao NotebookLM

Tempo de leitura: 2 min
© 2023 Fidemo Sociedade de Media
Gerir a sua privacidade

Para fornecer as melhores experiências, nós e os nossos parceiros usamos tecnologias como cookies para armazenar e/ou aceder a informações do dispositivo. O consentimento para essas tecnologias permitirá que nós e os nossos parceiros processemos dados pessoais, como comportamento de navegação ou IDs exclusivos neste site e mostrar anúncios (não) personalizados. Não consentir ou retirar o consentimento pode afetar adversamente certos recursos e funções.

Clique abaixo para consentir com o acima ou fazer escolhas granulares. As suas escolhas serão aplicadas apenas a este site. Pode alterar suas configurações a qualquer momento, incluindo a retirada de seu consentimento, usando os botões de alternância na Política de Cookies ou clicando no botão de consentimento para gerir na parte inferior do ecrã.

Funcional Sempre ativo
O armazenamento ou acesso técnico é estritamente necessário para o fim legítimo de permitir a utilização de um determinado serviço expressamente solicitado pelo assinante ou utilizador, ou para o fim exclusivo de efetuar a transmissão de uma comunicação numa rede de comunicações eletrónicas.
Preferências
O armazenamento ou acesso técnico é necessário para o propósito legítimo de armazenamento de preferências não solicitadas pelo assinante ou utilizador.
Estatísticas
O armazenamento técnico ou acesso que é usado exclusivamente para fins estatísticos. O armazenamento técnico ou acesso que é usado exclusivamente para fins estatísticos anónimos. Sem uma intimação, conformidade voluntária por parte do seu Fornecedor de Serviços de Internet ou registos adicionais de terceiros, as informações armazenadas ou recuperadas apenas para esse fim geralmente não podem ser usadas para identificá-lo.
Marketing
O armazenamento ou acesso técnico é necessário para criar perfis de utilizador para enviar publicidade ou para rastrear o utilizador num site ou em vários sites para fins de marketing semelhantes.
Estatísticas

Marketing

Recursos
Sempre ativo

Sempre ativo
Gerir opções Gerir serviços Gerir {vendor_count} fornecedores Leia mais sobre esses propósitos
Gerir opções
{title} {title} {title}