Em resumo
- Anthropic está preparando Claude Opus 4.7 e uma ferramenta de design de IA para sites e apresentações
- Claude Mythos continua sendo o verdadeiro modelo de fronteira da Anthropic, e a empresa não o divulgará publicamente.
- A indústria ainda não consegue medir com segurança as melhorias da IA, tornando difícil verificar as afirmações sobre os ganhos do Opus 4.7.
A Anthropic está se preparando para lançar Claude Opus 4.7 junto com uma nova ferramenta de design com tecnologia de IA que permite aos usuários criar sites, apresentações e páginas de destino com instruções simples em inglês – notícia que causou uma queda nos compartilhamentos da Adobe, Wix e Figma na segunda-feira, de acordo com A informação.
Os produtos podem sair ainda esta semana, disse uma pessoa com conhecimento dos planos A informação. A ferramenta de design tem como alvo desenvolvedores e usuários não técnicos, colocando-a em rota de colisão com startups como Gamma e Stitch do Google.
Antrópico não respondeu Descriptografarpedido de comentário.
Opus 4.7 nem é o modelo mais poderoso da Antrópico. Esse título pertence a Claude Mythos – uma fera focada em segurança cibernética que a empresa está entregando discretamente para empresas de segurança selecionadas, ao mesmo tempo que a mantém longe do público.
O AI Security Institute do Reino Unido avaliou recentemente o Mythos Preview e descobriu que ele pode executar de forma autônoma ataques cibernéticos sofisticados a taxas que nenhum outro modelo igualou. Tornou-se a primeira IA a concluir “The Last Ones”, uma simulação de ataque à rede corporativa de 32 etapas que normalmente leva 20 horas para equipes vermelhas humanas. Mythos acertou em três de dez tentativas, com média de 22 de 32 passos – em comparação com 16 do Opus 4.6.
Isso é importante além da segurança empresarial. Medir o que a IA pode realmente fazer tornou-se uma dor de cabeça para todo o setor. A OpenAI recentemente chamou o benchmark de codificação líder de “contaminado”, mas os modelos continuam a ser comparados usando os mesmos testes. Uma avaliação separada do ARC-AGI-3 viu o Gemini pontuar 0,37% e o GPT-5.4 atingir 0,26% – enquanto os humanos obtiveram 100%. O resultado é um cenário onde os benchmarks são contestados e ainda usados como evidência, tornando difícil contextualizar as afirmações sobre os ganhos do Opus 4.7 até que a Anthropic libere um cartão de modelo detalhado.
A relação entre Opus e Mythos é mais próxima do que muitos imaginam. A Anthropic constrói seus modelos de fronteira ajustando a linha Opus – a mesma espinha dorsal que alimenta os produtos públicos Claude é testada contra estresse e endurecida em Mythos. Opus 4.7 é a base que eventualmente leva o kung fu da segurança cibernética a ser derrotado.
Além disso, os esforços da Anthropic têm se direcionado mais para o caso de uso de desenvolvimento/empresa. O vazamento do código de Claude, o lançamento do sistema de habilidades e do protocolo MCP, o foco na IA de agência e o cuidado nos benchmarks de codificação tornam isso ainda mais evidente. Embora a Anthropic não tenha anunciado isso formalmente, os vazamentos reforçam a mudança mais ampla do provedor LLM para algo que se assemelha a um modelo full-stack de “estúdio de IA”, onde Claude não apenas gera texto, mas constrói e implanta produtos completos.
Resumo Diário Boletim informativo
Comece cada dia com as principais notícias do momento, além de recursos originais, podcast, vídeos e muito mais.
Fontedecrypt




