A Anthropic lançou o Claude Opus 4.8, uma atualização do Claude Opus 4.7 que, segundo a empresa, traz resultados aprimorados para codificação, trabalho do agente, raciocínio e trabalho de conhecimento. A plataforma pode ser utilizada através de claude.ai, Claude Code e Claude API, com o nome de API claude-opus-4-8.
A empresa também alterou alguns detalhes de sua linha de produtos. Os usuários de Claude.ai e Cowork podem definir a quantidade de esforço que Claude aplica a uma resposta – essencialmente, afetando o número de tokens que o modelo irá queimar. Claude Code também possui fluxos de trabalho dinâmicos, um recurso que planeja o trabalho, executa subagentes paralelos, verifica resultados e reporta ao usuário. Por fim, a API de mensagens aceita alterações ao vivo na matriz de mensagens, o que, segundo a Anthropic, permite que os desenvolvedores atualizem as instruções durante uma tarefa sem interromper o uso do cache de prompt ou precisar de um turno separado do usuário.
A Anthropic disse que o preço de uso do Claude Opus 4.8 quando não estiver no modo ‘rápido’ permanecerá em US$ 5 por milhão de entrada e US$ 25 por milhão de tokens de saída, enquanto o modo rápido custa US$ 10 por milhão de tokens de entrada e US$ 50 por milhão de saída. O modo rápido para Opus 4.8 funciona a 2,5x, afirma o anúncio da empresa.
A empresa posicionou o Opus 4.8 como projetado para codificação e fluxos de trabalho de agente em codificação, onde o modelo pode usar ferramentas dentro de um contexto e verificar seu próprio trabalho. Ele diz que o Opus 4.8 melhora o Opus 4.7 em benchmarks de codificação, habilidades do agente, raciocínio e trabalho de escritório. Existe um Cartão do Sistema que pode ser examinado para obter mais detalhes subjetivos.
O anúncio da Anthropic cita várias empresas que testaram a plataforma antes de seu lançamento mais amplo, incluindo aquelas que operam em desenvolvimento de software, direito, finanças e pesquisa. Vários testadores comentaram sobre os fluxos de trabalho de agente da plataforma, com um deles observando uma paridade de custos com o GPT-5.5 ao executar seus testes de benchmark internos. Um comentário do CursorBench disse que o Opus 4.8 usou menos etapas de ferramenta para atingir o mesmo nível de saída.
A Anthropic diz que o Opus 4.8 tem menos probabilidade do que seu antecessor 4.7 de passar código defeituoso sem comentários, o que descreve quatro vezes menos provável. Ele afirma que a plataforma apresentou taxas mais baixas de engano ou tendência de uso indevido do que o Opus 4.7 e é comparável, nesse aspecto, às exibidas pelo Claude Mythos Preview.
O controle de esforço ajuda os usuários a gerenciar qualquer compensação entre qualidade, velocidade e taxas de consumo de token. O padrão do Opus 4.8 é alto esforço, mas em tarefas de codificação, a empresa disse que o padrão mais alto usa apenas o tipo de número de token do Opus 4.7, mas tem melhor desempenho. Os usuários podem optar por ‘xhigh’ para trabalhos que necessitam de mais computação. A Anthropic disse que aumentou os limites de taxa do Código Claude para apoiar o maior uso de tokens resultante.
Os fluxos de trabalho dinâmicos no Claude Code são projetados para grandes bases de código e podem migrar bases de código de centenas de milhares de linhas. Esses recursos estão atualmente em visualização de pesquisa e estão disponíveis nos planos Enterprise, Team e Max.
A API de mensagens atualiza instruções durante a execução de um agente, com edições dentro da matriz de mensagens sendo usadas, por exemplo, para atualizar permissões, alterar orçamentos de token ou contexto enquanto os agentes continuam seu trabalho.
A Anthropic também aproveitou o lançamento para sugerir que está desenvolvendo modelos que forneçam os níveis atuais de capacidade a um custo menor para o usuário e lançará uma classe de modelo melhor que a plataforma Opus atual. Seu roteiro inclui o Projeto Glasswing, no qual um grupo de organizações está usando o Claude Mythos Preview para verificação de segurança cibernética. A Antthropic disse que os modelos nesse nível de capacidade exigem salvaguardas mais fortes antes do lançamento para todos os clientes. Ela espera trazer modelos da ‘classe Mythos’ aos clientes nas próximas semanas.
Os controles adicionais em 4.8 exporão as compensações de custo e esforço aos usuários à medida que a empresa faz a transição dos níveis de assinatura para o faturamento baseado em token.
(Fonte da imagem: Pixabay, sob licença.)
Quer saber mais sobre IA e big data dos líderes do setor? Confira a AI & Big Data Expo que acontece em Amsterdã, Califórnia e Londres. O evento abrangente faz parte da TechEx e é realizado junto com outros eventos de tecnologia líderes. Clique aqui para mais informações.
AI News é desenvolvido pela TechForge Media. Explore outros eventos e webinars de tecnologia empresarial futuros aqui.
Fontesartificialintelligence

