PCGuia PCGuia
  • [email protected]
  • Dicas
    • Apps
    • Descomplicómetro
    • Download da semana
    • Guia completo
    • Inteligência Artificial
    • Linux
    • Modding
    • Photoshop
    • Teste de velocidade da Internet
    • Open Source
  • MacGuia
  • Jogos
  • Notícias
    • Ambiente
    • Apps
    • Ciência
    • Curiosidades
    • Hardware
    • Inteligência Artificial
    • Internet
    • Mercados
    • Mobilidade
    • Multimédia
    • Robots
    • Segurança
    • Software
    • Startup
    • Especiais
      • Especial PCGuia
      • História
  • Reviews
    • Armazenamento
    • Áudio
    • Componentes
    • Desktops
    • Gadgets
    • Imagem
    • Mobilidade
    • Periféricos
    • Robótica
  • Opinião
    • Conceito Humanoide
    • Há Uma App Para Tudo
    • O Que Vem à Rede
    • Praia das Maçãs
    • Quinta Coluna
  • Precisa de ajuda?
  • Contactos
  • Como testamos os produtos
  • Termos de utilização
  • Política de privacidade e cookies
  • Estatuto Editorial
  • Declaração de Privacidade
  • Política de Cookies
© 2023 - Fidemo Sociedade de Media
A ler: De acordo com documentos judiciais, a equipa da Meta descarregou ilegalmente quase 82 TB de livros para treinar a sua IA
Font ResizerAa
PCGuia PCGuia
Font ResizerAa
Procurar
  • Dicas
  • Jogos
  • Linux
  • Notícias
  • Opinião
  • Reviews
  • Cookie Policy
© 2023 Fidemo Sociedade de Média
PCGuia > Notícias > Inteligência Artificial > De acordo com documentos judiciais, a equipa da Meta descarregou ilegalmente quase 82 TB de livros para treinar a sua IA
Inteligência ArtificialNotícias

De acordo com documentos judiciais, a equipa da Meta descarregou ilegalmente quase 82 TB de livros para treinar a sua IA

A Meta está a contas com a justiça por, alegadamente, ter usado material pirateado para o treino dos seus modelos de Inteligência Artificial.

Pedro Tróia
Publicado em 10 de Fevereiro, 2025
Tempo de leitura: 5 min
Logo Meta

A empresa-mãe do Facebook, a Meta, está actualmente a lutar contra uma acção judicial colectiva que alega violação de direitos de autor e concorrência desleal, entre outros, relativamente à forma como treinou o LLaMA. De acordo com uma publicação no X de vx-underground, registos judiciais revelam que a empresa de redes sociais usou torrents pirateados para descarregar 81,7 TB de dados de bibliotecas clandestinas, incluindo o Anna’s Archive, Z-Library e LibGen. Em seguida, usou a informação para treinar os seus modelos de IA.

- Publicidade -

As provas, sob a forma de comunicação escrita, mostram as preocupações dos investigadores sobre o uso de materiais pirateados pela Meta. Em Outubro de 2022, um investigador sénior de IA disse: “Não acho que devamos usar material pirateado. Preciso mesmo de traçar uma linha aqui.” Enquanto outro disse: “Usar material pirateado deve estar além do nosso limiar ético”, acrescentando depois: “SciHub, ResearchGate, LibGen são basicamente como o PirateBay ou algo do género, estão a distribuir conteúdo protegido por direitos de autor e estão a infringi-los.”

Depois, em Janeiro de 2023, o próprio Mark Zuckerberg participou numa reunião onde disse: “Precisamos de fazer esta coisa avançar… precisamos de encontrar uma maneira de desbloquear tudo isto.” Cerca de três meses depois, um funcionário da Meta enviou uma mensagem a outro dizendo que estava preocupado com o facto de os endereços IP da Meta estarem a ser usados “para fazer download de conteúdo pirateado”. Acrescentou ainda: “Usar torrents a partir de um portátil da empresa não parece bem”, seguido de emojis de riso.

Unsealed court documents from February 5th, 2024, in Kadrey v. Meta show Meta (formerly Facebook) illegally torrented 81.7TB of data from “shadow libraries” such as Anna’s Archive, Z-Library, and LibGen to train Meta artificial intelligence.

Highlights include:
– A senior AI… pic.twitter.com/Bqf60Hhbb6

— vx-underground (@vxunderground) February 8, 2025

Além destas mensagens, os documentos também revelaram que a empresa tomou medidas para que a sua infra-estrutura não fosse usada nessas operações de download e de seeding, para que estas actividades não fossem rastreadas até à Meta. Os documentos judiciais afirmam que isto constitui prova das actividades ilegais da Meta, que, neste caso, parece estar a tomar medidas deliberadas para contornar as leis de direitos de autor.

No entanto, esta não é a primeira vez que as empresas que investem na criação e treino de modelos de IA são acusadas de roubar informação da Internet para as suas actividades. Em Junho de 2023, a OpenAI foi processada por vários autores por usar as suas obras para treinar os seus modelos de linguagem de larga escala. Em Dezembro do mesmo ano foi a vez do The New York Times processar a empresa.

A Nvidia também foi alvo de um processo movido por vários autores que acusaram a empresa de usar sem permissão 196.640 livros para treinar o seu modelo NeMo, que, entretanto, foi desactivado. Um ex-funcionário da Nvidia denunciou a empresa em Agosto do ano passado, dizendo que esta recolhia mais de 426 mil horas de vídeos diariamente para usar no treino de IA. Mais recentemente, a OpenAI está a investigar se a DeepSeek obteve ilegalmente dados do ChatGPT, o que mostra tudo isto não está livre de ser irónico.

O caso contra a Meta ainda está a decorrer, pelo que teremos de esperar que o tribunal divulgue a sua decisão para dizer se a empresa cometeu uma infracção. E mesmo que os autores ganhem este caso, a Meta, com a sua enorme capacidade financeira, provavelmente recorrerá da decisão, o que significa que teremos de esperar vários meses, senão anos, para ficar a saber o desfecho deste caso.

- Publicidade -
Etiquetas:Meta
Ad image
Apoio
Ad image Ad image

Também lhe pode interessar

Painel_Solar
AmbienteNotícias

Cientistas criam nova tecnologia de painéis solares que produzem até 1.000 vezes mais energia que os painéis convencionais

Tempo de leitura: 4 min
Wikipedia New
Inteligência ArtificialNotícias

Editores da Wikipédia revoltaram-se contra os de artigos feitos por IA

Tempo de leitura: 4 min
©Garmin | Venu X1
MobilidadeNotícias

Venu X1: o novo relógio ultrafino da Garmin é «ultrafino» e tem um ecrã de duas polegadas

Tempo de leitura: 1 min
©TCL | Z100
MultimédiaNotícias

Z100 com Dolby Atmos FlexConnect: TCL lança coluna para cinema em casa com tecnologia inédita?

Tempo de leitura: 1 min
© 2023 Fidemo Sociedade de Media
Gerir a sua privacidade

Para fornecer as melhores experiências, nós e os nossos parceiros usamos tecnologias como cookies para armazenar e/ou aceder a informações do dispositivo. O consentimento para essas tecnologias permitirá que nós e os nossos parceiros processemos dados pessoais, como comportamento de navegação ou IDs exclusivos neste site e mostrar anúncios (não) personalizados. Não consentir ou retirar o consentimento pode afetar adversamente certos recursos e funções.

Clique abaixo para consentir com o acima ou fazer escolhas granulares. As suas escolhas serão aplicadas apenas a este site. Pode alterar suas configurações a qualquer momento, incluindo a retirada de seu consentimento, usando os botões de alternância na Política de Cookies ou clicando no botão de consentimento para gerir na parte inferior do ecrã.

Funcional Sempre ativo
O armazenamento ou acesso técnico é estritamente necessário para o fim legítimo de permitir a utilização de um determinado serviço expressamente solicitado pelo assinante ou utilizador, ou para o fim exclusivo de efetuar a transmissão de uma comunicação numa rede de comunicações eletrónicas.
Preferências
O armazenamento ou acesso técnico é necessário para o propósito legítimo de armazenamento de preferências não solicitadas pelo assinante ou utilizador.
Estatísticas
O armazenamento técnico ou acesso que é usado exclusivamente para fins estatísticos. O armazenamento técnico ou acesso que é usado exclusivamente para fins estatísticos anónimos. Sem uma intimação, conformidade voluntária por parte do seu Fornecedor de Serviços de Internet ou registos adicionais de terceiros, as informações armazenadas ou recuperadas apenas para esse fim geralmente não podem ser usadas para identificá-lo.
Marketing
O armazenamento ou acesso técnico é necessário para criar perfis de utilizador para enviar publicidade ou para rastrear o utilizador num site ou em vários sites para fins de marketing semelhantes.
Estatísticas

Marketing

Recursos
Sempre ativo

Sempre ativo
Gerir opções Gerir serviços Gerir {vendor_count} fornecedores Leia mais sobre esses propósitos
Gerir opções
{title} {title} {title}