Decrypt logoOpenAI CEO Sam Altman. Image: Shutterstock/Decrypt

Em resumo

  • OpenAI introduziu novos testes internos para desempenho em nível de projeto.
  • Os benchmarks científicos e matemáticos mostraram pontuações mais altas do que os modelos anteriores.
  • O anúncio ocorre no momento em que a OpenAI faz acordos para integrar a GPT ao governo e às corporações dos EUA.

Poucas semanas após seu último grande lançamento, a OpenAI está transformando agressivamente seu carro-chefe, ChatGPT, de uma novidade para o consumidor em uma potência corporativa indispensável.

Na quinta-feira, a empresa lançou o GPT-5.2, um novo modelo de linguagem grande que afirma ser mais rápido, confiável e projetado para lidar com fluxos de trabalho profissionais complexos.

A atualização sinaliza que a OpenAI está indo além da ajuda com o dever de casa e das consultas gerais, visando, em vez disso, incorporar sua tecnologia como uma ferramenta diária essencial no mundo dos negócios, como evidenciado por seus lucrativos acordos com o governo dos EUA e a Disney.

“Projetamos o GPT‑5.2 para desbloquear ainda mais valor econômico para as pessoas”, disse a OpenAI em comunicado. “É melhor para criar planilhas, construir apresentações, escrever códigos, perceber imagens, compreender contextos longos, usar ferramentas e lidar com projetos complexos de várias etapas.”

A nova referência para automação no local de trabalho

Promovendo o desempenho do GPT-5.2, a empresa introduziu um benchmark de avaliação proprietário, GDPval, que simula tarefas em 44 ocupações.

O GPT-5.2 igualou ou excedeu o desempenho do trabalhador humano em aproximadamente 71% das comparações, afirma a empresa.

“No GDPval, o modelo de pensamento supera ou vincula especialistas humanos em 70,9% das tarefas profissionais comuns, como planilhas, apresentações e criação de documentos”, escreveu Fidji Simo, CEO de aplicativos da OpenAI, no X. “Também é melhor em inteligência geral, escrita de código, chamada de ferramentas, visão e compreensão de longo contexto para que possa desbloquear ainda mais valor econômico para as pessoas.”

Não está claro se o índice de referência foi submetido a uma revisão externa, deixando os especialistas do setor à espera de uma verificação independente das alegações.

Análise técnica: Três modelos para três empregos

GPT-5.2 tornou-se disponível em níveis de assinatura paga na quinta-feira, com acesso à API abrindo no mesmo dia. Os desenvolvedores agora podem escolher entre três versões distintas, cada uma otimizada para diferentes necessidades profissionais.

  • Instantâneo: Para tarefas profissionais rápidas e simples.
  • Pensamento: Para tarefas mais complexas e com várias etapas.
  • Pró: O modelo de primeira linha, desenvolvido para pesquisas intensivas e projetos de longo prazo.

O preço da API foi definido em US$ 1,75 por milhão de tokens de entrada e US$ 14 por milhão de tokens de saída.

Além do benchmark GDPval, o GPT-5.2 apresentou melhor desempenho em testes técnicos estabelecidos, registrando pontuações mais altas no GPQA Diamond e FrontierMath. Também demonstrou resultados mais confiáveis ​​em tarefas exigentes como codificação, análise de dados e design experimental.

No anúncio, a empresa apresentou várias declarações de feedback elogiosas dos primeiros testadores.

O lançamento de uma IA mais competente no local de trabalho chega num ambiente de trabalho já tenso.

Os executivos corporativos parecem bastante otimistas, com uma pesquisa recente da Just Capital mostrando que 93% dos líderes empresariais veem a IA como uma força positiva. No entanto, o mesmo estudo descobriu que quase metade dos americanos espera que a tecnologia elimine empregos, uma preocupação que os executivos alegadamente partilham menos.

Geralmente inteligente Boletim informativo

Uma jornada semanal de IA narrada por Gen, um modelo generativo de IA.

Fontedecrypt

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *