Nos últimos tempos têm surgido vários casos de empresas ligadas à indústria de IA a serem alvo de acções judiciais. Em Julho, a Meta recebeu uma queixa, apresentada pela Strike 3 Holdings e pela Counterlife Media, criadoras de marcas de séries de vídeos de entretenimento para adultos.
De acordo com o site TorrentFreak, as duas empresas alegam que a Meta descarregou ilegalmente pelo menos 2.369 dos seus vídeos desde 2018 para treinar a sua IA.
A alegação decorre de uma acção judicial intentada contra a Meta por um grupo de autores em 2024. Depois de esse caso ter revelado que a Meta usou a rede de partilha de ficheiros Bittorrent para fazer downloads ilegais, a Strike 3 Holdings verificou as suas ferramentas de rastreio de concebidas para detectar violações de direitos de autor dos seus vídeos. Isto revelou vários endereços IP identificados como propriedade da Meta. Alega-se ainda que a Meta ocultou uma “rede oculta” composta por 2.500 endereços IP.
Porque é que a Meta iria querer usar quase 2.400 vídeos pornográficos para treinar a sua IA? A Strike 3 diz que foi para treinar secretamente uma versão para adultos não anunciada do seu modelo de IA para o sistema de geração de vídeo Movie Gen. Como tal, a produtora exige 359 milhões de dólares em indemnizações.
A Meta, claro, nega todas as acusações e pediu que o processo seja arquivado. Porque a Strike tem fama de ser um “troll de direitos de autor” que move acções judiciais extorsivas.
A gigante das redes sociais apresenta vários argumentos para a sua defesa. Refere que 2018 – quando a Strike 3 diz que as infracções começaram – foi anos antes de a Meta ter sequer começado a pesquisar LLM (Modelos de Linguagem de Larga Escala) e vídeo generativo, que só começou a fazer em 2022.
Há também o facto importante de que os termos de utilização da Meta proíbem a geração de conteúdo para adultos pelas suas IA.
Quanto aos endereços IP usados como prova, a Meta diz que o pequeno número de downloads – cerca de 22 por ano em média em dezenas de endereços IP da Meta – indica claramente que os vídeos foram descarregados através de Bitorrent para uso pessoal. No caso de pirataria dos autores, por exemplo, a Meta admite ter usado o conjunto de dados Book3, uma compilação de 37 GB de 195.000 livros com direitos de autor para treinar os seus LLM.
Com dezenas de milhares de funcionários e inúmeros contratados, visitantes e terceiros a acederem à internet na Meta todos os dias, a empresa afirma que é impossível saber quem descarregou os clips ou se eram funcionários da Meta.
Há também uma alegação de que um contratado da Meta foi instruído a descarregar conteúdo para adultos na casa do seu pai. A Meta argumenta que não há razão para que um engenheiro de automação seja obrigado a obter material de treino de IA na sua função, especialmente na casa do seu pai, e que este foi, também, obviamente, um caso de uso pessoal.
“[E]stas alegações falham não só por falta de factos de apoio, mas também porque a teoria de responsabilidade dos Queixosos não faz sentido e não pode ser conciliada com os factos que alegam. A queixa inteira contra a Meta deve ser arquivada”, conclui a Meta.
Em Agosto, a Anthropic concordou em pagar aos autores 1,5 mil milhões de dólares pelo alegado uso de livros pirateados para o treino de LLM. Entretanto a Apple foi processada por vários autores em Setembro por alegações de que usou um conhecido conjunto de livros pirateados para treinar o seu LLM OpenELM.