Decrypt logoJudge's gavel. Source: Decrypt/Shutterstock

A OpenAI sofreu um revés legal em sua batalha de direitos autorais, quando um juiz federal decidiu que os autores podem prosseguir com alegações de que a empresa baixou ilegalmente seus livros.

O juiz distrital dos EUA, Sidney H. Stein, negou a moção da OpenAI para atacar o que a empresa caracterizou como uma nova “reivindicação de download” em uma decisão na segunda-feira, concluindo que reclamações anteriores notificaram adequadamente a OpenAI sobre alegações de violação baseadas no download e reprodução de livros protegidos por direitos autorais.

“Uma queixa não precisa vincular o pedido de reparação do demandante a uma teoria jurídica precisa”, disse o juiz Stein em sua decisão, observando que “só as alegações factuais são o que importa”.

Ele concedeu alívio parcial à OpenAI, atacando alegações sobre GPT-4V, GPT-4.5, GPT-5 e quaisquer “derivados” ou “sucessores”, alegando que seu pedido de maio limita o caso a sete modelos (GPT-3 a GPT-4o Mini).

A disputa de “reivindicação de download”

O caso faz parte de um enorme litígio multidistrital (MDL) que consolida vários processos de direitos autorais contra a OpenAI e a Microsoft no Distrito Sul de Nova York. Um MDL combina casos semelhantes de diferentes tribunais num único processo para um tratamento eficiente antes do julgamento.

Esta ação consolidada inclui reclamações dos autores David Baldacci, Michael Chabon e outros, alegando que a OpenAI “capturou, baixou e copiou trabalhos escritos protegidos por direitos autorais” sem permissão.

Em sua moção de greve, a OpenAI argumentou que a reclamação consolidada introduziu indevidamente uma nova teoria jurídica ao separar as alegações de download das reivindicações baseadas em treinamento.

O juiz Stein rejeitou este argumento, concluindo que reclamações anteriores de ação coletiva já haviam “afirmado uma causa de ação por violação de direitos autorais e alegado que a OpenAI baixou e reproduziu inadmissivelmente os livros dos demandantes”.

O fato de muitas alegações sugerirem que “o objetivo final da reprodução era treinar os LLMs da OpenAI não é positivo”, escreveu ele.

Navodaya Singh Rajpurohit, sócio jurídico da Coinque Consulting, disse Descriptografar que “os autores podem precisar mostrar evidências concretas de que seus livros estavam nos dados de treinamento”.

Os tribunais ordenaram a produção de “canais Slack discutindo a remoção dos conjuntos de dados de livros” e exigiram que a OpenAI preservasse “logs de saída e metadados completos”, acrescentou, para “rastrear se obras específicas foram ingeridas”.

“Esses registros, juntamente com quaisquer arquivos de teste ou listas de livros fornecidos pelo fornecedor, podem ser importantes na descoberta”, disse o advogado.

A OpenAI pode argumentar que os downloads vieram de fontes públicas ou licenciadas, disse Rajpurohit, observando que reconheceu o licenciamento do conteúdo do editor e afirma que o treinamento em material disponível publicamente é um uso justo e transformador, e parcerias recentes com a mídia sugerem um licenciamento mais claro que apoia a legalidade.

Batalhas de direitos autorais em toda a indústria

A OpenAI está rechaçando uma série de processos de direitos autorais, um deles liderado por O jornal New York Timesalegando que ele e a Microsoft usaram “milhões de artigos com acesso pago” para construir um “substituto de mercado” para as notícias.

Em maio, um tribunal ordenou que a OpenAI “preservasse e separasse todos os dados de log de saída”, incluindo bate-papos excluídos; A OpenAI contestou o pedido em junho, chamando-o de “um exagero por parte O jornal New York Times”Isso prejudica a privacidade do usuário.

Em junho, Meta e Anthropic obtiveram vitórias parciais com o juiz Vince Chhabria considerando o uso justo do treinamento de livros da Meta, observando que os demandantes “apresentaram os argumentos errados”, enquanto o juiz William Alsup também considerou o uso justo do treinamento da Anthropic, mas criticou sua “biblioteca permanente de livros piratas”.

Geralmente inteligente Boletim informativo

Uma jornada semanal de IA narrada por Gen, um modelo generativo de IA.

Fontedecrypt

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *