Decrypt logoOpenAI. Image: Shutterstock/Decrypt

Em resumo

  • A divisão Model Behavior, liderada por Joanne Jang, introduziu uma estrutura para quantificar e reduzir preconceitos políticos em grandes modelos de linguagem.
  • O GPT-5 Instant e o GPT-5 Thinking exibiram 30% menos preconceito do que as versões anteriores quando testados em 500 solicitações politicamente carregadas.
  • As descobertas sublinham a tentativa da OpenAI de contrariar a percepção de que os sistemas de IA se inclinam política ou culturalmente numa direcção.

A OpenAI afirma que seus mais novos modelos ChatGPT apresentam visivelmente menos preconceito político do que as versões anteriores, à medida que a empresa expande os esforços para fazer com que os sistemas de inteligência artificial pareçam mais equilibrados em tom e raciocínio.

A empresa sediada em São Francisco divulgou na quinta-feira as descobertas de sua divisão Model Behavior, liderada por Joanne Jang, que estuda como as solicitações do usuário e o alinhamento do modelo moldam as respostas do ChatGPT.

No mês passado, Jang criou um grupo voltado para pesquisas, denominado OAI Labs, focado em “inventar e prototipar novas interfaces para como as pessoas colaboram com IA”.

Em sua pesquisa, a equipe teve como objetivo traduzir uma questão subjetiva em métricas quantificáveis ​​que pudessem orientar o design do modelo.

As descobertas sublinham a tentativa da OpenAI de contrariar a percepção de que os sistemas de IA se inclinam política ou culturalmente numa direcção.

A pesquisadora Natalie Staudacher detalhou os resultados publicamente, descrevendo o trabalho como a tentativa mais abrangente da OpenAI até agora para definir, medir e mitigar preconceitos políticos em grandes modelos de linguagem.

A avaliação testou respostas modelo a 500 solicitações que variavam de neutras a emocionalmente carregadas, refletindo como os usuários enquadram questões políticas em ambientes do mundo real.

O lançamento segue o relatório anual da OpenAI conferência de desenvolvedores no início desta semana, onde o CEO Sam Altman revelou novas ferramentas que transformam o ChatGPT em uma plataforma de aplicativos para desenvolvedores.

Embora esse anúncio tenha se concentrado na expansão das capacidades do modelo, a pesquisa de quinta-feira centra-se em como essas capacidades se comportam, especialmente em relação à neutralidade, ao tom e à confiança do usuário.

A OpenAI disse que seus mais recentes modelos GPT-5 Instant e GPT-5 Thinking mostraram 30% menos preconceito mensurável do que GPT-4o e o3, especialmente ao abordar tópicos controversos ou partidários.

“O ChatGPT não deveria ter preconceito político em nenhuma direção”, escreveu Staudacher no X, chamando o projeto de sua contribuição mais “significativa” na OpenAI.

Staudacher disse que o preconceito político apareceu apenas raramente e com “baixa severidade”, mesmo sob testes de estresse que procuravam deliberadamente provocar linguagem tendenciosa ou emocional.

“Milhões de pessoas vêm ao ChatGPT para compreender o mundo ao seu redor e formar suas próprias perspectivas”, escreveu Staudacher. “Ao definir o que significa preconceito, esperamos tornar a nossa abordagem mais clara, responsabilizar-nos e ajudar os outros, construindo definições partilhadas.”

Geralmente inteligente Boletim informativo

Uma jornada semanal de IA narrada por Gen, um modelo generativo de IA.

Fontedecrypt

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *