OpenAI. Image: Shutterstock/Decrypt

Em resumo

  • A decisão obriga a OpenAI a fornecer 20 milhões de registros de bate-papo após meses de disputas sobre privacidade, preservação e escopo.
  • A juíza Ona T. Wang decidiu que o tamanho da amostra é “proporcional” ao que o caso precisa para provar se o ChatGPT produz conteúdo reproduzido do Times.
  • O caso junta-se a uma onda crescente de desafios de direitos autorais que visam a forma como os laboratórios de IA obtêm e usam dados de treinamento.

Um juiz federal ordenou que a OpenAI entregasse cerca de 20 milhões de logs ChatGPT desidentificados para O jornal New York Times e outros demandantes, aprofundando a exposição da empresa de desenvolvimento de IA a uma série de disputas de direitos autorais e governança de dados.

Emitido na quarta-feira em Nova York, a ordem nega a oferta da OpenAI de bloquear a produção de registros de bate-papo de usuários e orienta a empresa a entregar os registros sob uma estrutura de proteção.

O resultado pode moldar a forma como empresas de tecnologia como OpenAI, Anthropic e Perplexity obtêm dados de treinamento, licenciam conteúdo e constroem proteções em torno e sobre o que seus sistemas podem produzir.

Embora o tribunal “reconheça que as considerações de privacidade dos usuários da OpenAI são sinceras”, tais considerações “são apenas um fator na análise de proporcionalidade e não podem predominar onde há relevância clara e carga mínima”, escreveu a juíza magistrada dos EUA Ona T. Wang.

Descriptografar entrou em contato com ambas as partes para comentar.

A ordem decorre da contínua ação judicialque alega que os modelos da OpenAI foram treinados em conteúdo de notícias protegido por direitos autorais sem permissão. Foi antecipado pela primeira vez em dezembro de 2023.

Em janeiro do ano passado, OpenAI desafiado as reivindicações do NYT e entrou com uma ação reconvencional, alegando que a publicação não estava “contando a história completa”.

Mais tarde, o tribunal concluiu que os 20 milhões de amostras de registos de chat em questão são “proporcionais às necessidades do caso” para avaliar se os resultados do ChatGPT copiaram o material do NYT.

Ao longo do ano passado, a disputa intensificou-se, com os demandantes a pressionarem por um amplo acesso aos dados de produção, e a OpenAI a alertar que a produção expansiva destes materiais aumentaria a privacidade e os encargos operacionais.

Em junho, a OpenAI enfrentou outro revés quando o tribunal encomendado a empresa manterá uma ampla gama de dados de usuários do ChatGPT para o processo, incluindo bate-papos que os usuários já tenham excluído.

Meses depois, em outubro, a disputa ressurgiu, com o tribunal sinalização O arquivamento da OpenAI de 20 de outubro (ECF 679) que contestou a produção da amostra de 20 milhões de toras e ordenou que ambos os lados apresentassem esclarecimentos sobre por que discordavam.

Na época, o juiz pressionou as partes a explicarem como a briga estava relacionada a preocupações anteriores sobre registros excluídos e se a OpenAI havia desistido de acordos anteriores sobre o que alegou anteriormente que iria entregar.

No final do mês passado, a OpenAI apresentou uma objeção formal pedindo ao juiz distrital que anulasse a ordem de descoberta do juiz magistrado.

A empresa argumentou que a decisão era “claramente errônea” e “desproporcional”, na medida em que forçaria a empresa a divulgar milhões de conversas privadas de usuários, de acordo com um documento judicial compartilhado com Descriptografar por um representante da OpenAI.

A disputa surge como parte de uma ofensiva mais ampla contra os laboratórios de IA, com autores, organizações de notícias, editores musicais e repositórios de código que procuram testar até que ponto a lei de direitos de autor existente se estende quando os modelos ingerem e reproduzem material protegido.

Os tribunais dos EUA e da Europa estão agora a analisar reivindicações semelhantes.

Geralmente inteligente Boletim informativo

Uma jornada semanal de IA narrada por Gen, um modelo generativo de IA.

Fontedecrypt

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *