Em resumo
- OpenRouter lançou o Fusion em 12 de junho, uma API do lado do servidor que exibe um prompt para um painel de modelos e, em seguida, usa um juiz e um sintetizador para mesclar a melhor resposta.
- No benchmark DRACO da Perplexity, um painel orçamentário de diferentes IAs ficou dentro de 1% do Fable 5 por aproximadamente metade do custo.
- A técnica surgiu quando uma diretiva de controle de exportação dos EUA forçou a Anthropic a suspender Fable 5 e Mythos 5.
OpenRouter lançou uma API construída em torno de uma aposta simples: que um painel de modelos baratos de IA, combinados da maneira certa, pode corresponder a um único modelo caro. E por “caro” eles querem dizer Claude Fable 5.
O produto se chama Fusion. Ele envia um prompt para vários modelos em paralelo e, em seguida, usa um modelo de juiz e um sintetizador para mesclar os resultados em uma resposta fundamentada.
O momento é fortuito. Pouco depois de lançar Fable 5 e Mythos 5 na semana passada, uma diretiva de controle de exportação dos EUA forçou a Anthropic a suspender esses modelos para todos os estrangeiros em todo o mundo, citando uma descoberta contestada de jailbreak. O OpenRouter levou a notícia ao X no dia seguinte, indo direto para a lacuna com a promessa de “inteligência de nível Fable pela metade do preço”.
Apresentamos a API Fusion, o modelo composto mais inteligente do mercado.
O Fusion atinge inteligência de nível Fable pela metade do preço.
Como funciona 👇 pic.twitter.com/OTUQAdTQjU
– OpenRouter (@OpenRouter) 13 de junho de 2026
Como conseguir uma Fábula barata
Quando você envia um prompt ao Fusion, o OpenRouter o envia para um painel de modelos em paralelo. Cada um obtém ferramentas de pesquisa na web e bash.
Então, um modelo de juiz extrai pontos de consenso, contradições e pontos cegos de cada resposta. Após o término dessa fase, um sintetizador – Claude Opus 4.8 por padrão – escreve a resposta final com base nessa análise.
A coisa toda acontece no lado do servidor. Você pode trocar a string do seu modelo para “openrouter/fusion” para um painel padrão, adicionar uma ferramenta de fusão para que seu próprio modelo a chame seletivamente ou criar um painel personalizado na sala de bate-papo do Fusion sem código.
O OpenRouter testou isso no DRACO, o benchmark da Perplexity construído a partir de solicitações de pesquisa profunda de usuários reais. Fable 5 emparelhado com GPT-5.5 da OpenAI e sintetizado pela Opus liderou a parada com 69%. Solo Fable obteve 65,3%, embora sete de suas 100 tarefas nunca tenham sido executadas porque seus próprios filtros de conteúdo as bloquearam.
A combinação mais barata é aquela que o OpenRouter deseja lembrar: o barato Gemini 3 Flash combinado com os modelos chineses de código aberto Kimi K2.6 e DeepSeek V4 Pro, fundidos e sintetizados pela Opus, atingiu 64,7% – superando o solo GPT-5.5 (60%) e o solo Opus 4.8 (58,8%) de uma vez e chegando a um ponto de Fable por cerca de metade do custo.
Mesmo emparelhando o Opus 4.8 com uma instância separada obteve 65,5%, um salto de 6,7 pontos sobre o Opus solo; OpenRouter diz que cerca de três quartos desse aumento vem da própria etapa de síntese, o restante da diversidade genuína de modelos.
Uma desvantagem: fornecer ao painel acesso ao vivo à Web permite que os modelos exibam a própria rubrica de classificação do DRACO nos resultados de pesquisa, um risco de contaminação que o OpenRouter chama de coincidência em vez de deliberado. A correção exigiu uma linha de configuração para excluir os domínios de hospedagem do benchmark das ferramentas de pesquisa, e cada número publicado reflete essa execução de limpeza.
Vale a pena tentar?
O OpenRouter afirma que o Fusion não é um substituto completo do Fable. DRACO ignora o trabalho de longo prazo, onde Fable supostamente ainda lidera, e para codificação, Fusion funciona como uma ferramenta que um modelo de codificação chama seletivamente, não uma troca no atacado – uma advertência que ecoa o que Descriptografar encontrei testando o DeepClaude, um backend swap mais barato que mantém o loop do agente de Claude Code intacto, mas ainda segue o Opus nas tarefas de raciocínio mais difíceis.
O modelo regular ainda cuida das coisas do dia a dia. A fusão existe para questões em que um modelo pode perder algo importante, e ter algumas perspectivas cruzando-se entre si realmente move a agulha.
Para pesquisas profundas, planejamento complexo ou qualquer coisa em que as contradições sejam importantes, a sala parece ajudar.
Os gráficos deixam o ponto básico bastante claro: neste tipo de trabalho, o caro modelo solo não é mais a única maneira de obter uma síntese forte. Um grupo de modelos que ainda são fáceis de obter, fundidos, pode ficar ao lado dele nos resultados e, ao mesmo tempo, entregar uma conta muito menor.
O tópico de lançamento foi dividido em cerca de dois para um positivo no rastreamento de sentimento. O pesquisador de IA Andrew Trask chamou isso de “um negócio muito maior do que parece”, argumentando que os laboratórios de fronteira nunca mais serão os donos da fronteira sozinhos. Os céticos, no entanto, recuaram no enquadramento, citando maus resultados de codificação, má chamada de ferramentas e falta de transparência, uma vez que o Fable 5 não está mais disponível para comparar resultados.
O Fusion é executado inteiramente em modelos roteados pela própria infraestrutura do OpenRouter, portanto não resolve o problema de controle de exportação na origem. Qualquer pessoa bloqueada no Fable 5 agora tem opções: um painel Fusion, uma troca de backend como DeepClaude ou alternativas abertas como GLM-5.2 que podem não ser melhores, mas são boas o suficiente para o preço.
Resumo Diário Boletim informativo
Comece cada dia com as principais notícias do momento, além de recursos originais, podcast, vídeos e muito mais.
Fontedecrypt




