O modelo de IA mais capaz da Anthropic já encontrou milhares de vulnerabilidades de segurança cibernética de IA em todos os principais sistemas operacionais e navegadores da web. A resposta da empresa não foi divulgá-lo, mas entregá-lo discretamente às organizações responsáveis ​​por manter a Internet funcionando.

Esse modelo é Claude Mythos Preview, e a iniciativa se chama Projeto Glasswing.

Os parceiros de lançamento incluem Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, Linux Foundation, Microsoft, Nvidia e Palo Alto Networks.

Além desse grupo principal, a Anthropic estendeu o acesso a mais de 40 organizações adicionais que constroem ou mantêm infraestruturas de software críticas. A Anthropic está comprometendo até US$ 100 milhões em créditos de uso para o Mythos Preview em todo o esforço, junto com US$ 4 milhões em doações diretas para organizações de segurança de código aberto.

Um modelo que superou seus próprios benchmarks

O Mythos Preview não foi treinado especificamente para trabalhos de segurança cibernética. A Anthropic disse que os recursos “surgiram como uma consequência posterior de melhorias gerais no código, raciocínio e autonomia”, e que as mesmas melhorias que tornam o modelo melhor na correção de vulnerabilidades também o tornam melhor na exploração delas.

Essa última parte é importante. O Mythos Preview melhorou a ponto de saturar principalmente os benchmarks de segurança existentes, forçando a Anthropic a mudar seu foco para novas tarefas do mundo real – especificamente, vulnerabilidades de dia zero. Essas falhas eram anteriormente desconhecidas pelos desenvolvedores do software.

Entre as descobertas: um bug de 27 anos no OpenBSD, um sistema operacional conhecido por sua forte postura de segurança. Em outro caso, o modelo identificou e explorou de forma totalmente autônoma uma vulnerabilidade de execução remota de código de 17 anos no FreeBSD – CVE-2026-4747 – que permite que um usuário não autenticado em qualquer lugar da Internet obtenha controle completo de um servidor executando NFS. Nenhum ser humano esteve envolvido na descoberta ou exploração após a solicitação inicial para encontrar o bug.

Nicholas Carlini, da equipe de pesquisa da Anthropic, descreveu a capacidade do modelo de encadear vulnerabilidades: “Este modelo pode criar explorações a partir de três, quatro ou às vezes cinco vulnerabilidades que, em sequência, fornecem algum tipo de resultado final muito sofisticado. Encontrei mais bugs nas últimas semanas do que encontrei no resto da minha vida combinada.”

Por que não está sendo lançado?

“Não planejamos disponibilizar o Claude Mythos Preview para todos devido às suas capacidades de segurança cibernética”, disse Newton Cheng, líder cibernético da equipe Frontier Red da Anthropic. “Dada a taxa de progresso da IA, não demorará muito até que essas capacidades proliferem, potencialmente para além dos intervenientes que estão empenhados em implementá-las com segurança. As consequências – para as economias, a segurança pública e a segurança nacional – poderão ser graves.”

Isto não é hipotético. A Anthropic já havia divulgado o que descreveu como o primeiro caso documentado de um ataque cibernético em grande parte executado pela IA – um grupo patrocinado pelo Estado chinês que usou agentes de IA para se infiltrar autonomamente em cerca de 30 alvos globais, com a IA lidando com a maioria das operações táticas de forma independente.

A empresa também informou em particular altos funcionários do governo dos EUA sobre todas as capacidades do Mythos Preview. A comunidade de inteligência está agora avaliando ativamente como o modelo poderia remodelar as operações de hackers ofensivas e defensivas.

O problema do código aberto

Uma dimensão do Projeto Glasswing que vai além da coalizão principal: software de código aberto. Jim Zemlin, CEO da Linux Foundation, disse claramente: “No passado, a experiência em segurança era um luxo reservado a organizações com grandes equipes de segurança. Os mantenedores de código aberto, cujo software sustenta grande parte da infraestrutura crítica do mundo, historicamente foram deixados para descobrir a segurança por conta própria.”

A Anthropic doou US$ 2,5 milhões para Alpha-Omega e OpenSSF por meio da Linux Foundation, e US$ 1,5 milhão para a Apache Software Foundation – dando aos mantenedores de bases de código de código aberto críticas acesso à verificação de vulnerabilidades de segurança cibernética de IA em uma escala que antes estava fora de alcance.

O que vem a seguir

A Anthropic diz que seu objetivo final é implantar modelos da classe Mythos em escala, mas somente quando novas salvaguardas estiverem em vigor. A empresa planeja lançar novas salvaguardas primeiro com um próximo modelo Claude Opus, permitindo refiná-las com um modelo que não representa o mesmo nível de risco que o Mythos Preview.

O quadro competitivo já está mudando em torno disso. Quando a OpenAI lançou o GPT-5.3-Codex em fevereiro, a empresa o chamou de o primeiro modelo classificado como de alta capacidade para tarefas de segurança cibernética em sua Estrutura de Preparação. A mudança da Anthropic com o Glasswing sinaliza que os laboratórios de fronteira veem a implantação controlada – e não a liberação aberta – como o padrão emergente para modelos neste nível de capacidade.

Se esse padrão se mantém à medida que estas capacidades se espalham ainda mais é, neste momento, uma questão em aberto que nenhuma iniciativa isolada pode responder.

Veja também: A recusa da Anthropic em armar a IA é exatamente a razão pela qual o Reino Unido a deseja

Quer saber mais sobre IA e big data dos líderes do setor? Confira a AI & Big Data Expo que acontece em Amsterdã, Califórnia e Londres. O evento abrangente faz parte da TechEx e está localizado junto com outros eventos de tecnologia líderes, incluindo o Cyber ​​Security & Cloud Expo. Clique aqui para mais informações.

AI News é desenvolvido pela TechForge Media. Explore outros eventos e webinars de tecnologia empresarial futuros aqui.

Fontesartificialintelligence

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *