Principais vantagens:
- A Anthropic lançou o Claude Opus 4.7 em 16 de abril de 2026, apresentando uma pontuação de 87,6% no teste SWE-bench Verified.
- A mudança da indústria de IA em direção à autonomia das agências faz com que o Opus 4.7 supere o GPT-5.4 em codificação e finanças complexas.
- Os desenvolvedores devem gerenciar os custos, pois o novo modelo usa de 1,0 a 1,35 vezes mais tokens do que a versão 4.6 anterior.
AI Evolution: Claude Opus 4.7 lançado com visão e memória aprimoradas
A startup de IA com sede em São Francisco posicionou o lançamento como seu modelo mais capaz disponível até o momento. Ele serve como uma atualização direcionada em relação à versão Opus 4.6 que chegou há apenas dois meses, em fevereiro.
Embora o restrito Claude Mythos Preview permaneça em testes limitados para segurança cibernética, o Opus 4.7 foi desenvolvido para o mercado mais amplo. Ele se concentra especificamente em engenharia de software, tarefas de longo prazo e análises financeiras complexas.
As métricas de desempenho divulgadas pela Anthropic mostram que o modelo ganha terreno significativo em fluxos de trabalho autônomos. No benchmark de codificação verificada do SWE-bench, o novo modelo atingiu 87,6%, acima dos 80,8% vistos na versão 4.6.
O modelo também conseguiu superar sua concorrência primária em diversas categorias importantes. A Anthropic relatou que o Opus 4.7 superou o GPT-5.4 da OpenAI e o Gemini 3.1 Pro do Google em uso de ferramentas e testes de interação com computador.
Uma das mudanças mais visíveis envolve uma atualização massiva nas capacidades de visão do modelo. Claude Opus 4.7 agora pode processar imagens de até 2.576 pixels na borda longa, o que é o triplo do limite de resolução anterior.
Esse aumento visual permite que a IA interprete melhor gráficos complexos, interfaces de usuário e diagramas técnicos. No entanto, a empresa observou que imagens de resolução mais alta consomem mais tokens, aumentando potencialmente os custos para usuários de alto volume.
A Anthropic também introduziu um novo recurso chamado /ultrareview em seu ambiente Claude Code. Esta ferramenta permite que usuários profissionais e de nível máximo executem sessões multiagentes para identificar bugs e falhas de design no software.
Para os profissionais financeiros, o modelo apresenta maior grau de rigor na modelagem econômica. Alcançou uma pontuação de 0,813 no módulo Finanças Gerais, representando um avanço significativo em relação à classificação de 0,767 da versão anterior.
A estrutura de preços do modelo permanece inalterada em US$ 5 por milhão de tokens de entrada e US$ 25 por milhão de tokens de saída. Para ajudar a gerenciar despesas durante longas execuções autônomas, a Anthropic adicionou um recurso de orçamento de tarefas na versão beta pública.
Instruções para um T
O feedback inicial da comunidade de desenvolvedores sugere que o modelo é mais literal no seguimento das instruções. Essa alteração pode exigir que os usuários reajustem os prompts existentes que foram otimizados para versões mais antigas da família Claude.
“Claude 4.7 foi lançado e usá-lo é como entrar em um carro de F1. Muito mais potência e faz exatamente o que você manda a toda velocidade. Seu trabalho é escolher a direção e fazer as curvas”, escreveu um usuário no X.
Alguns testadores observaram que o tokenizer atualizado pode usar até 1,35 vezes mais tokens para a mesma entrada. Embora isso possa levar a um esgotamento mais rápido dos limites, a empresa argumenta que o desempenho por tarefa justifica o uso.
A segurança continua a ser um foco central, uma vez que o modelo inclui novas salvaguardas automatizadas para bloquear utilizações de cibersegurança de alto risco. A carta do sistema da Anthropic destaca maior honestidade e maior resistência à geração de conteúdo prejudicial.
O modelo agora está disponível por meio da API Claude, Amazon Bedrock, Google Vertex AI e Microsoft Foundry. Ele mantém a janela de contexto de 1 milhão de tokens introduzida no início deste ano.
Fontenews.bitcoink




