Decrypt logoMeta. Image: Shutterstock/Decrypt

Em resumo

  • A Meta pediu a um tribunal dos EUA que rejeitasse uma ação movida pela Strike 3 Holdings, alegando que ela usou IPs corporativos e ocultos para torrentar quase 2.400 filmes adultos desde 2018 para desenvolvimento de IA.
  • Meta diz que o pequeno número de supostos downloads aponta para “uso pessoal” por indivíduos, e não para treinamento de IA.
  • A empresa nega usar qualquer conteúdo adulto em seu modelo, chamando a teoria do treinamento de IA de “suposições e insinuações”.

A Meta pediu a um tribunal dos EUA que rejeitasse um processo que a acusava de baixar e distribuir ilegalmente milhares de vídeos pornográficos para treinar seus sistemas de inteligência artificial.

Apresentada na segunda-feira no Tribunal Distrital dos EUA para o Distrito Norte da Califórnia, a moção para rejeitar argumenta que não há evidências de que os modelos de IA da Meta contenham ou tenham sido treinados com material protegido por direitos autorais, chamando as alegações de “absurdas e sem suporte”.

A moção foi relatada pela primeira vez por Ars Técnica na quinta-feira, com Meta negando diretamente dizendo que as alegações são “falsas”.

Os demandantes fizeram “um grande esforço para unir esta narrativa com suposições e insinuações, mas suas reivindicações não são convincentes nem apoiadas por fatos bem alegados”, diz a moção.

A reclamação original foi apresentada em julho pela Strike 3 Holdings e alegou que a Meta usou endereços IP corporativos e ocultos para enviar torrent de quase 2.400 filmes adultos desde 2018, como parte de um esforço mais amplo para construir sistemas multimodais de IA.

Strike 3 Holdings é uma holding de filmes adultos com sede em Miami que distribui conteúdo sob marcas como Vixen, Blacked e Tushy, entre outras.

Descriptografar entrou em contato com Meta e Strike 3 Holdings, bem como com seus respectivos consultores jurídicos, e atualizará este artigo caso respondam.

Escala e padrão

A moção da Meta argumenta que a escala e o padrão dos supostos downloads contradizem a teoria de treinamento de IA do Strike 3.

Ao longo de sete anos, apenas 157 filmes de Strike 3 foram supostamente baixados usando endereços IP corporativos da Meta, uma média de cerca de 22 por ano em 47 endereços diferentes.

A meta-advogada Angela L. Dunning caracterizou isso como “atividade escassa e descoordenada” de “indivíduos díspares” fazendo isso para “uso pessoal” e, portanto, não foi, como alega Strike 3, parte de um esforço do gigante da tecnologia para coletar dados para treinamento de IA.

A moção também rejeita a alegação do Strike 3 de que a Meta usou mais de 2.500 endereços IP “ocultos” de terceiros e afirma que o Strike 3 não verificou quem era o proprietário desses endereços e, em vez disso, fez “correlações” soltas.

Uma das faixas de IP está supostamente registrada em nome de uma organização sem fins lucrativos havaiana sem vínculo com a Meta, enquanto outras não têm proprietário identificado.

A Meta também argumenta que não há provas de que tivesse conhecimento ou pudesse ter interrompido os supostos downloads, acrescentando que não ganhou nada com eles e que monitorar todos os arquivos em sua rede global não seria simples nem exigido por lei.

Treinando com segurança

Embora a defesa da Meta pareça “incomum” a princípio, ela ainda pode ter peso, visto que a alegação principal se baseia em como “o material não foi usado em nenhum treinamento de modelo”, disse Dermot McGrath, cofundador da empresa de capital de risco Ryze Labs. Descriptografar.

“Se a Meta admitisse que os dados foram usados ​​em modelos, eles teriam que argumentar sobre o uso justo, justificar a inclusão de conteúdo pirata e abrir-se à descoberta de seus sistemas internos de treinamento e auditoria”, disse McGrath, acrescentando que, em vez de defender como os dados foram supostamente usados, a Meta negou que “eles tenham sido usados”.

Mas se os tribunais admitirem tal defesa como válida, poderá abrir “uma enorme lacuna”, disse McGrath. Poderia “minar efetivamente a proteção de direitos autorais para casos de dados de treinamento de IA”, de modo que casos futuros precisariam de “evidências mais fortes de direção corporativa, que as empresas simplesmente conseguiriam esconder melhor”.

Ainda assim, existem razões legítimas para processar material explícito, como o desenvolvimento de ferramentas de segurança ou moderação.

“A maioria das grandes empresas de IA tem ‘equipes vermelhas’ cujo trabalho é sondar os modelos em busca de pontos fracos, usando avisos prejudiciais e tentando fazer com que a IA gere conteúdo explícito, perigoso ou proibido”, disse McGrath. “Para construir filtros de segurança eficazes, você precisa treiná-los com exemplos do que você está tentando bloquear.”

Geralmente inteligente Boletim informativo

Uma jornada semanal de IA narrada por Gen, um modelo generativo de IA.

Fontedecrypt

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *