
Desenvolvido em colaboração com a Paradigm, o EVMbench avalia a capacidade dos agentes de IA de detectar, corrigir e explorar vulnerabilidades de contratos inteligentes.
EVMbench, uma ferramenta de benchmarking, foi criada para aprimorar a segurança do blockchain, medindo as capacidades dos agentes de IA na detecção, correção e exploração de vulnerabilidades em contratos inteligentes. Esta nova ferramenta sublinha o papel crescente da inteligência artificial no reforço da segurança dos ecossistemas financeiros descentralizados (DeFi).
EVMbench emprega vulnerabilidades históricas e um equipamento baseado em Rust para avaliar o desempenho da IA. Na vanguarda está o GPT-5.3-Codex, um modelo de IA desenvolvido pela OpenAI, que alcançou uma pontuação de 72,2% nas avaliações do modo de exploração.
A avaliação do EVMbench é abrangente, utilizando 120 vulnerabilidades selecionadas de mais de 40 auditorias. Estes incluem cenários fornecidos pelo Tempo L1, que se concentra em avaliações orientadas para pagamentos.
A ferramenta também se beneficia da expertise da Paradigm, que proporciona conhecimento de domínio e controle de qualidade. Esta colaboração garante a precisão e confiabilidade das avaliações do EVMbench.
Este artigo foi gerado com a ajuda de fluxos de trabalho de IA.
Fontesthedefiant



