GPT-5.5 da OpenAI corresponde a Claude Mythos em capacidades de ataque cibernético: AI Security Institute

Em resumo

O GPT-5.5 pode executar ataques cibernéticos sofisticados de forma autônoma, completando uma simulação de rede corporativa de 32 etapas e resolvendo um quebra-cabeça de segurança de 12 horas em apenas 10 minutos.
A capacidade cibernética ofensiva da IA está melhorando rapidamente entre os desenvolvedores, com o AISI alertando que novos avanços podem chegar em rápida sucessão.
Os pesquisadores encontraram um jailbreak que contornou totalmente as grades de segurança do GPT-5.5, disparando alarmes.

Uma agência governamental do Reino Unido descobriu que o mais novo modelo de inteligência artificial da OpenAI pode realizar ataques cibernéticos complexos de forma autônoma – e que resolveu um desafio de engenharia reversa em pouco mais de 10 minutos, o que levou cerca de 12 horas para um especialista em segurança humana.

O AI Security Institute (AISI), um órgão de pesquisa do Departamento de Ciência, Inovação e Tecnologia da Grã-Bretanha, publicou resultados na quinta-feira mostrando que o GPT-5.5 está entre os modelos mais fortes que avaliou para capacidades cibernéticas ofensivas, colocando-o quase no mesmo nível do alardeado Claude Mythos da Anthropic.

O relatório descobriu que o GPT-5.5 é o segundo modelo a completar o teste mais exigente do AISI – um ataque simulado de rede corporativa de 32 etapas chamado “Os Últimos” – fazendo isso de forma autônoma em duas de cada 10 tentativas. O primeiro modelo a atingir o marco foi o Claude Mythos Preview da Anthropic, que completou a simulação em três das 10 tentativas.

A simulação de rede corporativa, construída com a empresa de segurança cibernética SpecterOps, exige que um agente encadeie reconhecimento, roubo de credenciais, movimento lateral através de múltiplas florestas do Active Directory, um pivô da cadeia de suprimentos através de um pipeline de CI/CD e, por fim, a exfiltração de um banco de dados interno protegido – etapas que a AISI estima que um especialista humano levaria cerca de 20 horas.

Talvez o resultado mais impressionante tenha envolvido um quebra-cabeça de engenharia reversa terrivelmente difícil. O GPT-5.5 resolveu o desafio – que exigia reconstruir o conjunto de instruções de uma máquina virtual personalizada, escrever um desmontador do zero e recuperar uma senha criptográfica por meio de resolução de restrições – em 10 minutos e 22 segundos, a um custo de US$ 1,73 em uso de API. Um especialista humano, utilizando ferramentas profissionais, exigiu aproximadamente 12 horas.

Na bateria de tarefas avançadas de segurança cibernética do AISI, o GPT-5.5 alcançou uma taxa média de aprovação de 71,4% no nível mais difícil “Expert”, superando o Mythos Preview com 68,6% por cento e superando significativamente o GPT-5.4 com 52,4%.

As descobertas trazem implicações pontuais para a trajetória mais ampla do desenvolvimento da IA. A AISI concluiu que o desempenho do GPT-5.5 sugere que a rápida melhoria nas capacidades cibernéticas pode ser parte de uma tendência geral e não de um avanço isolado – e alertou que se as competências cibernéticas ofensivas estiverem a emergir como um subproduto de melhorias mais amplas no raciocínio, codificação e conclusão autónoma de tarefas, então novos avanços poderão chegar em rápida sucessão.

O relatório também sinalizou preocupações significativas sobre as grades de segurança do modelo. Os pesquisadores identificaram um jailbreak universal que gerou conteúdo prejudicial em todas as consultas cibernéticas maliciosas testadas, inclusive em ambientes de agente multiturno. O ataque levou seis horas de equipe vermelha especializada para ser desenvolvido. Posteriormente, a OpenAI atualizou sua pilha de salvaguarda, embora um problema de configuração tenha impedido a AISI de verificar se a versão final era eficaz.

A AISI alertou que as suas avaliações de capacidade foram conduzidas num ambiente de investigação controlado e não reflectem necessariamente o que é acessível a um utilizador comum, observando que as implantações públicas incluem salvaguardas adicionais e controlos de acesso.

O relatório surge num cenário preocupante para a segurança cibernética britânica. O relatório anual do governo do Reino Unido Pesquisa sobre violações de segurança cibernéticatambém publicado na quinta-feira, descobriu que 43% das empresas sofreram uma violação ou ataque cibernético nos últimos 12 meses.

Em resposta, o governo anunciou £ 90 milhões em novos financiamentos para aumentar a resiliência cibernética e disse que está avançando com a Lei de Segurança e Resiliência Cibernética para proteger serviços essenciais. As autoridades também publicaram orientações instando as organizações a se prepararem para um possível aumento nas vulnerabilidades de software recém-descobertas, à medida que a IA acelera o ritmo em que as falhas de segurança podem ser encontradas e transformadas em armas.

Resumo Diário Boletim informativo

Comece cada dia com as principais notícias do momento, além de recursos originais, podcast, vídeos e muito mais.

Fontedecrypt

GPT-5.5 da OpenAI corresponde a Claude Mythos em capacidades de ataque cibernético: AI Security Institute

ByDecrypt Agent

Em resumo

Resumo Diário Boletim informativo

By Decrypt Agent

Leia Também

HSBC expande parceria bancária de IA com Google Cloud

Implantações de visão computacional impulsionam ganhos de produtividade no varejo

🟢 AO VIVO – The Fable Backlash: Este é o caso da IA descentralizada?

Deixe um comentário Cancelar resposta

Leia Também:

HSBC expande parceria bancária de IA com Google Cloud

Implantações de visão computacional impulsionam ganhos de produtividade no varejo

🟢 AO VIVO – The Fable Backlash: Este é o caso da IA descentralizada?

Mastercard abre trilhos de cartão para agentes de IA com mais de 30 parceiros criptográficos