PCGuia PCGuia
  • [email protected]
  • Dicas
    • Apps
    • Descomplicómetro
    • Download da semana
    • Guia completo
    • Inteligência Artificial
    • Linux
    • Modding
    • Photoshop
    • Teste de velocidade da Internet
    • Open Source
  • MacGuia
  • Jogos
  • Notícias
    • Ambiente
    • Apps
    • Ciência
    • Curiosidades
    • Hardware
    • Inteligência Artificial
    • Internet
    • Mercados
    • Mobilidade
    • Multimédia
    • Robots
    • Segurança
    • Software
    • Startup
    • Especiais
      • Especial PCGuia
      • História
  • Reviews
    • Armazenamento
    • Áudio
    • Componentes
    • Desktops
    • Gadgets
    • Imagem
    • Mobilidade
    • Periféricos
    • Robótica
  • Opinião
    • Conceito Humanoide
    • Há Uma App Para Tudo
    • O Que Vem à Rede
    • Praia das Maçãs
    • Quinta Coluna
  • Precisa de ajuda?
  • Contactos
  • Como testamos os produtos
  • Termos de utilização
  • Política de privacidade e cookies
  • Estatuto Editorial
  • Declaração de Privacidade
  • Política de Cookies
© 2023 - Fidemo Sociedade de Media
A ler: Meta apanhada a “enganar” um site de benchmarks com modelos de IA que não correspondem à realidade?
Font ResizerAa
PCGuia PCGuia
Font ResizerAa
Procurar
  • Dicas
  • Jogos
  • Linux
  • Notícias
  • Opinião
  • Reviews
  • Cookie Policy
© 2023 Fidemo Sociedade de Média
PCGuia > Notícias > Inteligência Artificial > Meta apanhada a “enganar” um site de benchmarks com modelos de IA que não correspondem à realidade?
Inteligência ArtificialNotícias

Meta apanhada a “enganar” um site de benchmarks com modelos de IA que não correspondem à realidade?

À primeira vista, o Maverick parecia uma séria ameaça aos modelos das suas concorrentes, mas... há um problema.

Ricardo Durand
Publicado em 8 de Abril, 2025
Tempo de leitura: 3 min
©Meta | Llama 4
©Meta

A Meta lançou, nos últimos, dias, dois novos modelos de IA de gama “média”: os Llama 4 Scout e Maverick. Ambos foram submetidos aos benchmarks do site LMArena, um plataforma que que compara resultados de diferentes modelos, cabendo aos utilizadores decidir quais são os melhores.

- Publicidade -

Na sequência dos 1417 pontos que o Llama 4 Maverick conseguiu no teste ELO (originalmente criado para avaliar a capacidade de jogadores de xadrez, tendo mais tarde passado a ser usado em eSports), a Meta apontou, em comunicado, que isto o colocava acima do ChatGPT 4o e logo abaixo do Gemini 2.5 Pro.

Desta forma, o Maverick assumia-se como uma séria ameaça aos modelos das suas concorrentes, mas… há um problema. A documentação da Meta sobre esta IA mostra, nas chamadas “letras pequeninas” que a versão testada na LMArena não é a mesma que está disponível ao público, acusaram vários especialistas em IA, no X.

Desta forma, não terá as mesmas capacidades que uma chamada “versão comercial”, uma vez que foi reforçada apenas para ter um bom desempenho nos testes.

De acordo esta documentação, a Meta diz que submeteu uma «versão experimental de chat» do Maverick «especificamente optimizada para conversação», noticiou o TechCrunch, o que levou a uma reacção dura do LMArena: «A interpretação da Meta da nossa política não corresponde ao que esperamos dos fornecedores de modelos»

Os responsáveis do site acusam mesmo a empresa de Mark Zuckerberg de falta de transparência: «A Meta deveria ter deixado mais claro que o ‘Llama-4-Maverick-03-26-Experimental’ era um modelo personalizado para estes benchmarks». Na sequência desta polémica, o LMArena decidiu «actualizar as políticas de classificação para reforçar o compromisso com avaliações justas e reproduzíveis» com o objectivo de que este tipo de confusões «não volte a acontecer».

- Publicidade -

Da parte da Meta, há uma reacção de Ahmad Al-Dahle, vice-presidente de IA generativa, no X : «Simplesmente, não é verdade, nunca faríamos isso». O responsável esclareceu ainda que alguns utilizadores podem estar a a ter «experiências inconsistentes» com o Maverick pelo facto de nem todas as funcionalidades disponíveis quando os modelos são partilhados online,

«Uma vez que lançamos os modelos assim que ficaram prontos, esperamos que sejam necessários vários dias para que todas as implementações públicas sejam ligadas, disse Al-Dahle, que prometeu que a Meta vai «continuar a trabalhar na correcção de erros».

- Publicidade -
Etiquetas:inteligência artificial
Ad image
Apoio
Ad image Ad image

Também lhe pode interessar

©NASA
FormaçãoNotícias

Programa UT Austin Portugal anuncia novas formações online e gratuitas em LLM, observação espacial e machine learning

Tempo de leitura: 1 min
©Matt Palmer | Floresta Fogos
InovaçãoNotícias

«Gémeos digitais» das florestas são a mais recente inovação tecnológica para combater incêndios em território nacional

Tempo de leitura: 2 min
©Nova SBE
Notícias

Julho traz o regresso da Open and User Innovation Conference a Portugal; será na Nova SBE, em Carcavelos

Tempo de leitura: 1 min
InternetNotícias

Estão a circular outra vez clips de videojogos que tentam passar por vídeos reais de um conflito, desta vez é o que opõe Israel ao Irão

Tempo de leitura: 7 min
© 2023 Fidemo Sociedade de Media
Gerir a sua privacidade

Para fornecer as melhores experiências, nós e os nossos parceiros usamos tecnologias como cookies para armazenar e/ou aceder a informações do dispositivo. O consentimento para essas tecnologias permitirá que nós e os nossos parceiros processemos dados pessoais, como comportamento de navegação ou IDs exclusivos neste site e mostrar anúncios (não) personalizados. Não consentir ou retirar o consentimento pode afetar adversamente certos recursos e funções.

Clique abaixo para consentir com o acima ou fazer escolhas granulares. As suas escolhas serão aplicadas apenas a este site. Pode alterar suas configurações a qualquer momento, incluindo a retirada de seu consentimento, usando os botões de alternância na Política de Cookies ou clicando no botão de consentimento para gerir na parte inferior do ecrã.

Funcional Sempre ativo
O armazenamento ou acesso técnico é estritamente necessário para o fim legítimo de permitir a utilização de um determinado serviço expressamente solicitado pelo assinante ou utilizador, ou para o fim exclusivo de efetuar a transmissão de uma comunicação numa rede de comunicações eletrónicas.
Preferências
O armazenamento ou acesso técnico é necessário para o propósito legítimo de armazenamento de preferências não solicitadas pelo assinante ou utilizador.
Estatísticas
O armazenamento técnico ou acesso que é usado exclusivamente para fins estatísticos. O armazenamento técnico ou acesso que é usado exclusivamente para fins estatísticos anónimos. Sem uma intimação, conformidade voluntária por parte do seu Fornecedor de Serviços de Internet ou registos adicionais de terceiros, as informações armazenadas ou recuperadas apenas para esse fim geralmente não podem ser usadas para identificá-lo.
Marketing
O armazenamento ou acesso técnico é necessário para criar perfis de utilizador para enviar publicidade ou para rastrear o utilizador num site ou em vários sites para fins de marketing semelhantes.
Estatísticas

Marketing

Recursos
Sempre ativo

Sempre ativo
Gerir opções Gerir serviços Gerir {vendor_count} fornecedores Leia mais sobre esses propósitos
Gerir opções
{title} {title} {title}