Enquanto o O1 foi um grande avanço tecnológico, o GPT-5 é, acima de tudo, um produto refinado. Durante um briefing da imprensa, Sam Altman comparou o GPT-5 às exibições da Retina da Apple, e é uma analogia adequada, embora talvez não da maneira que ele pretendia. Assim como uma tela sem precedentes, o GPT-5 fornecerá uma experiência de usuário mais agradável e perfeita. Isso não é nada, mas fica muito aquém do futuro transformador da IA que Altman passou grande parte do ano passado. No briefing, Altman chamou o GPT-5 de “um passo significativo ao longo do caminho para a AGI”, ou inteligência geral artificial, e talvez ele esteja certo-mas, se sim, é um passo muito pequeno.

Pegue a demonstração das habilidades do modelo que o OpenAi mostrou MIT Technology Review antes de seu lançamento. Yann Dubois, uma vantagem pós-treinamento no Openai, pediu ao GPT-5 que projete um aplicativo da web que ajudasse seu parceiro a aprender francês para que ela pudesse se comunicar mais facilmente com sua família. O modelo fez um trabalho admirável de seguir suas instruções e criou um aplicativo atraente e fácil de usar. Mas quando eu dei ao GPT-4O um prompt quase idêntico, ele produziu um aplicativo com exatamente a mesma funcionalidade. A única diferença é que não foi tão esteticamente agradável.

Algumas das outras melhorias na experiência do usuário são mais substanciais. Ter o modelo em vez de o usuário optar por aplicar o raciocínio a cada consulta remove um grande ponto de dor, especialmente para usuários que não seguem de perto os avanços do LLM.

E, de acordo com Altman, o GPT-5 argumenta muito mais rápido que os modelos da série O. O fato de o OpenAi estar lançando para usuários que não pagam sugere que também é mais barato para a empresa executar. Isso é um grande negócio: executar modelos poderosos barato e rapidamente é um problema difícil, e resolver é essencial para reduzir o impacto ambiental da IA.

O Openai também tomou medidas para mitigar alucinações, que foram uma dor de cabeça persistente. As avaliações da OpenAI sugerem que os modelos GPT-5 têm uma probabilidade substancialmente menor de fazer reivindicações incorretas do que seus modelos antecessores, O3 e GPT-4O. Se esse avanço se mantiver em escrutínio, poderá ajudar a pavimentar o caminho para agentes mais confiáveis e confiáveis. “A alucinação pode causar problemas reais de segurança e segurança”, diz Dawn Song, professor de ciência da computação da UC Berkeley. Por exemplo, um agente que alucina os pacotes de software pode baixar código malicioso para o dispositivo de um usuário.

O GPT-5 alcançou o estado da arte em vários parâmetros de referência, incluindo um teste de habilidades agênticas e as avaliações de codificação SWE-banch e poliglota de caixa. Mas, de acordo com a Clémentine Fourrier, pesquisadora de IA da empresa Huggingface, essas avaliações estão se aproximando da saturação, o que significa que os modelos atuais alcançaram quase o desempenho máximo.

“É basicamente como olhar para o desempenho de um estudante do ensino médio em problemas de média da série”, diz ela. “Se o estudante do ensino médio falhar, ele lhe diz algo, mas se for bem -sucedido, não lhe diz muito.” Fourrier disse que ficaria impressionada se o sistema atingisse uma pontuação de 80% ou 85% no SWE-banch-mas conseguiu apenas 74,9%.

Por fim, a mensagem principal do OpenAI é que o GPT-5 parece melhor usar. “As vibrações desse modelo são realmente boas, e acho que as pessoas realmente sentirão isso, especialmente pessoas comuns que não passam o tempo pensando em modelos”, disse Nick Turley, chefe do ChatGPT.

Somente as vibrações não trarão o futuro automatizado que Altman prometeu. O raciocínio parecia um grande avanço no caminho para a AGI. Ainda estamos esperando o próximo.

technologyreview

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *