Decrypt logoSam Altman presenting GPT-5. Image: OpenAI

Em resumo

  • O GPT-5 foi lançado com poderes multimodais unificados-texto, imagens, voz e vídeo ao vivo-tudo em um pacote; Não há mais manipulação de bots separados para todas as tarefas.
  • O lançamento começa hoje para todos os usuários do ChatGPT, mas os recursos de energia e a velocidade máxima vão para os assinantes profissionais; A Microsoft o conecta ao Copilot e Github no primeiro dia.
  • O OpenAi apresenta o “raciocínio no nível de especialistas” e uma memória que nunca dorme-mais grandes atualizações para codificação, escrita criativa e confiabilidade.

O Openai apresentou o GPT-5 durante uma transmissão ao vivo de quinta-feira, marcando o que a empresa chamou de mudança qualitativa na capacidade de inteligência artificial após vários meses de antecipação e vários atrasos. O modelo está sendo lançado para todos os usuários do ChatGPT ao longo do dia hoje.

A versão representa a tentativa do OpenAI de unificar suas várias tecnologias de IA em um único sistema. A Companhia descreveu o raciocínio como central para sua estratégia de inteligência geral artificial, com a inovação eliminando as compensações anteriores entre velocidade e profundidade analítica. Os usuários não precisam mais escolher entre respostas rápidas e recursos de raciocínio profundo-o GPT-5 entrega ambos simultaneamente.

Aqui está uma folha de trapaceiros sobre o que você precisa saber.

1. Quando posso obtê -lo?

O GPT-5 é lançado hoje no ChatGPT e através de sua API. A Microsoft também incorporou o GPT-5 em seus produtos imediatamente, disponibilizando-o através do Copilot e do GitHub Copilot.

Se você atualizou seu navegador de borda com a Copilot, estará pronto para usá -lo agora.

2. Todos recebem a mesma versão?

Sim, mais ou menos: os usuários gratuitos de camadas começarão com o GPT-5 padrão antes de fazer a transição para uma versão mais leve do “GPT-5 Mini” quando esgotarem sua cota de uso. Os assinantes do Pro (US $ 200 por mês) têm acesso ilimitado ao modelo completo, enquanto os assinantes mais (US $ 20/mês) têm acesso ao GPT-5 padrão.

Os assinantes profissionais podem executar o GPT-5 no seu nível de inteligência mais alto, com recursos adicionais, como acesso precoce a seus agentes avançados, uso ilimitado, mais recursos para pesquisas profundas, acesso prioritário e modo de voz avançado com limites mais altos para compartilhamento de vídeo e tela.

3. O que significa multimodal? Um gerador de imagem separado desaparece?

Multimodal significa que o GPT-5 pode processar e gerar diferentes tipos de conteúdo-texto, imagens, voz e agora até vídeo-tudo dentro da mesma conversa. O modelo mostrou um entendimento aprimorado de linguagem estrangeira para tarefas complexas, gerando sites completos com palavras francesas e pronúncia adequada.

Em vez de fazer malabarismos entre Vision, Sora, GPT e os modelos “O” para a razão, o GPT-5 pode fazer tudo por si só.

4. Qual é o tamanho da janela de contexto e por que isso importa?

O GPT-5 possui uma janela de contexto de 256.000 token para entrada, com a API aceitando até 272.000 tokens de entrada e emitindo um máximo de 128.000 tokens de raciocínio e saída, para um comprimento total de contexto de 400.000 tokens.

Isso significa que ele pode processar cerca de 200.000 palavras ao mesmo tempo – equivalentes a um longo romance. A janela de contexto maior permite que o GPT-5 mantenha conversas coerentes em interações muito mais longas e analisem bases de código inteiras ou documentos longos sem perder os detalhes importantes.

Dito isto, essa janela não é muito grande pelos padrões de hoje. Apenas para o contexto, Gemini 2.5 é capaz de lidar com 1 milhão de tokens,

5. Que novos recursos ele tem?

Nenhum, na verdade, mas algumas de suas habilidades são atualizadas a um grau que elas se sentirão como novos recursos.

6. Então, o que há de tão bom nisso?

O GPT-5 é mais poderoso em quase todas as formas. Por exemplo, demonstrou recursos notáveis de codificação durante a apresentação, escrevendo mais de 400 linhas de código em dois minutos quando solicitado a criar uma simulação de efeito Bernoulli a partir do zero. Outras coisas legais mostradas na demonstração:

  • Foram apresentadas interações de voz menos recursos de vídeo robótico e ao vivo que combinam com concorrentes como Gemini Live.
  • O modelo agora pode analisar imagens carregadas e incorporá -las em suas respostas.
  • É melhor em tarefas Agentic e supostamente é capaz de lidar com aplicativos do mundo real e explicar seu raciocínio.
  • Na próxima semana, os usuários poderão integrar o Gmail e o Google Calendário, o que permitirá que ele seja um assistente muito melhor.

7. Os preços mudaram?

O preço da assinatura do ChatGPT permanece inalterado a US $ 20/mês por mais e US $ 200/mês para o Pro.

Para usuários de API, o GPT-5 custa US $ 1,25 por milhão de tokens de entrada e tokens de produção de US $ 10,00 por milhão para o modelo padrão. O GPT-5 Mini custa US $ 0,25 por milhão de tokens de entrada e US $ 2,00 por milhão de tokens de produção, enquanto o GPT-5 Nano custa US $ 0,05 para entrada e US $ 0,40 para a produção.

Isso tornaria o modelo competitivo contra ofertas de outras empresas e ainda mais barato do que outros modelos do OpenAI como o GPT-4.1 ou o OpenAi O1 Pro, que custa um enorme tokens de US $ 600 por milhão.

8. Já estamos na AGI?

Não. No entanto, a empresa posicionou o raciocínio como “no coração do nosso programa AGI”.

O modelo representa um progresso significativo, mas permanece focado em tarefas específicas, em vez de combinar a inteligência humana em todos os domínios. Por exemplo, o GPT-5 é ótimo em tarefas de idioma, mas não possui a inteligência geral necessária para realizar uma ampla gama de atividades de forma independente. Ainda não é auto-ensino ou auto-adaptação.

9. O GPT-5 pode gerar vídeos?

Ainda não. Embora a geração de vídeo não tenha sido incluída no lançamento inicial, o OpenAI possui Sora para criação de vídeo como um produto separado.

O CEO Sam Altman indicou anteriormente que as versões futuras apoiariam o vídeo “Eventualmente”.

A versão atual entende o vídeo ao vivo, no entanto, para que você possa ver você tentar consertar uma bicicleta e fornecer instruções ao vivo.

10. Quão confiável é comparado aos modelos anteriores?

O OpenAI informou que o GPT-5 é “significativamente menos enganoso” do que os modelos anteriores, abordando um dos desafios mais persistentes na implantação de grandes modelos de idiomas.

Em benchmarks de precisão factual, o GPT-5 comete aproximadamente 80% menos erros factuais que a O3, tornando-o substancialmente mais confiável para aplicativos corporativos, de acordo com Jakub Pachocki, cientista-chefe da OpenAI.

11. E a memória e a personalização?

O GPT-5 supostamente oferecerá uma melhor memória persistente em sessões, lembrando fatos, preferências e instruções em várias conversas, mesmo se você fechar o aplicativo e abrir um novo Tab Days depois. A memória do GPT-4 era limitada, especialmente dias depois que uma sessão fez uma pausa.

A empresa disse que agora você pode definir objetivos de longo prazo (por exemplo, me ajude a perder 10 quilos de maneira saudável ou me ajudar a me preparar para o meu teste de física), e o GPT-5 adaptará suas respostas de acordo com o alinhar proativamente com seus objetivos.

12. Quão privado são meus dados pessoais?

Altman reconheceu anteriormente que o OpenAI poderia ter que entregar os dados pessoais de um usuário ao governo, se legalmente necessário.

13. Preciso mais alternar entre diferentes modelos?

Não é mais – a menos que você queira gerar vídeo via Sora. Com o lançamento do GPT-5, o OpenAI expressou confiança em depreciar todos os modelos anteriores.

A empresa projetou o GPT-5 para lidar com todos os casos de uso que exigiam modelos especializados anteriormente, embora os usuários ainda possam escolher entre o GPT-5, GPT-5 Mini e GPT-5 Nano com base nos requisitos de velocidade e custo.

Geralmente inteligente Boletim informativo

Uma jornada semanal de IA narrada por Gen, um modelo generativo de IA.

Fontedecrypt

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *