Mitigando a dependência do fornecedor com modelos multiagentes Sakana AI Fugu

A Sakana AI lançou o Fugu para orquestrar operações multiagentes e mitigar riscos de dependência de fornecedor único em implantações empresariais.

As empresas enfrentam vulnerabilidades operacionais quando dependem inteiramente de APIs de IA monolíticas. A empresa japonesa de IA Sakana AI projetou o Fugu como uma resposta a esses riscos de concentração, criando um modelo de linguagem de orquestração que recorre a um conjunto de modelos variados para concluir tarefas de várias etapas.

Os usuários acessam esse ecossistema por meio de um único endpoint compatível com OpenAI. Fugu encaminha consultas internamente, decidindo se resolve um prompt diretamente ou monta uma equipe coordenada de modelos especializados para uma análise mais profunda. O sistema lida internamente com seleção, delegação, verificação e síntese de modelos. As equipes de engenharia interagem com o que parece ser um modelo enquanto um sistema de especialistas executa a computação real.

A Sakana AI visa os riscos geopolíticos e regulatórios associados ao fornecimento de IA. Os recentes controlos de exportação que afectam modelos antrópicos como Fable e Mythos demonstraram que o acesso a arquitecturas fundamentais específicas pode desaparecer com base em decisões de política externa.

Fugu funciona como uma proteção contra essas interrupções repentinas na cadeia de abastecimento. A plataforma depende de um pool de agentes totalmente trocável. O Fugu roteia dinamicamente o tráfego em torno de qualquer provedor restrito ou degradado para manter a continuidade do serviço. Sakana AI afirma que esta capacidade fornece a arquitetura resiliente necessária para a soberania da IA.

Níveis de implantação do Fugu

Duas camadas estão disponíveis para acomodar diferentes requisitos de latência operacional.

O modelo Fugu padrão prioriza baixa latência para tarefas diárias, integrando-se a ferramentas de desenvolvedor padrão como Codex para codificação ao vivo e revisão de código. As organizações sujeitas a rigorosa governança de dados ou mandatos de privacidade podem optar manualmente por modelos subjacentes específicos do pool de roteamento padrão do Fugu.

O Fugu Ultra visa problemas analíticos complexos e de várias etapas que exigem precisão máxima. A variante Ultra coordena um grupo mais profundo de agentes especializados para tarefas intensivas, como reprodução de artigos acadêmicos, investigações de literatura e análise de patentes.

Sakana AI relata que o Fugu Ultra tem um desempenho competitivo em relação aos principais modelos fechados, como Fable 5 e Mythos Preview, em benchmarks científicos, de engenharia e de raciocínio:

O método de orquestração garante que as empresas possam acessar recursos de computação de alto nível sem correr o risco de concentração de fornecedores ou a exposição ao controle de exportação inerente a esses modelos fechados.

Implementação em segurança cibernética

Quase 500 usuários iniciais testaram o sistema durante um programa beta estendido focado em fluxos de trabalho computacionais longos e de várias etapas. Com o foco na segurança cibernética para modelos como Claude Mythos, as equipes de engenharia implantaram o Fugu Ultra para automatizar ciclos completos de avaliação de segurança.

Os operadores humanos emitiram uma instrução com escopo definido e o mecanismo de orquestração executou toda a fase de reconhecimento. O modelo conduziu com sucesso scripts entre sites e verificações de injeção de SQL, juntamente com análises completas de autenticação.

Um engenheiro de segurança cibernética participante confirmou que o modelo permaneceu estritamente dentro dos seus parâmetros operacionais e evitou iniciar ações destrutivas contra a infraestrutura alvo. Fugu concluiu o envolvimento automatizado gerando um relatório de vulnerabilidade limpo, completo com verificação de evidências e etapas exatas de reteste para equipes de correção humana.

A implementação demonstrou que o roteamento multiagente mantém limites rígidos de conformidade ao executar sequências complexas de testes de penetração.

As equipes de desenvolvimento de software também integraram o Fugu Ultra em seus pipelines primários de revisão de código para comparar as taxas de detecção de defeitos com ferramentas monolíticas estabelecidas. O mecanismo de orquestração superou consistentemente os modelos básicos na identificação de falhas lógicas e vulnerabilidades de segurança em bases de código empresariais complexas.

“Para revisão de código, o Fugu Ultra é significativamente melhor que o GPT-5.5. Ele fornece respostas abrangentes e encontra bugs que outros não percebem”, relatou um engenheiro de software envolvido na implantação beta. “Enquanto outras ferramentas sinalizam três problemas, o Fugu trouxe à tona mais de vinte. Tornou-se o modelo pelo qual executo todas as minhas análises.”

Pesquisa automatizada e estabilidade de personalidade

As unidades de ciência de dados implantaram o sistema em um modo de pesquisa quase totalmente automatizado. O Fugu Ultra explorou com sucesso hipóteses matemáticas, executou execuções experimentais de código, interpretou estados de falha e revisou suas próprias abordagens para sustentar o progresso por longos períodos com intervenção humana mínima. Esse recurso aborda diretamente as limitações operacionais dos modelos de chamada única que exigem solicitação humana constante para recuperação de erros lógicos.

A liderança de uma empresa de plataforma empresarial não identificada identificou a estabilidade da personalidade a longo prazo como a principal vantagem durante essas sessões prolongadas. As arquiteturas monolíticas convencionais geralmente sofrem degradação de contexto e desvio de identidade ao processar extensos históricos de conversação.

“A qualidade da produção bruta está no mesmo nível dos modelos de ponta, mas o Fugu mostrou uma estabilidade de personalidade excepcionalmente forte durante longas sessões, mantendo sua identidade onde outros modelos flutuam”, afirmou o executivo. “Para produtos de agentes, isso pode ser mais importante do que pontuações brutas de benchmark.”

Validação de benchmark estendida

Sakana AI construiu a lógica de roteamento interno com base em extensa pesquisa sobre orquestração de modelos aprendidos. A base técnica do produto deriva das descobertas publicadas nos documentos ICLR 2026 da empresa, especificamente nas estruturas Trinity e Conductor.

Essas bases acadêmicas permitem que Fugu processe solicitações entendendo precisamente quando uma tarefa requer delegação em vez de resolução direta. O modelo de linguagem interna dita protocolos de comunicação entre os agentes individuais e estrutura a síntese final de suas saídas computacionais separadas.

Os testes de validação contra concorrentes de ponta em IA cobriram disciplinas complexas e abertas, desde a previsão de séries temporais financeiras até o projeto mecânico. Fugu também demonstrou alta proficiência em testes de lógica física de nicho e tarefas de interpretação visual, incluindo a resolução do Cubo de Rubik e a realização de análises de caligrafia japonesa. A capacidade de se destacar tanto na modelagem financeira quantitativa quanto no processamento qualitativo de imagens confirma a eficácia da abordagem de orquestração multiagente.

A Sakana AI projetou o sistema para escalar organicamente à medida que o mercado mais amplo de hardware e software de IA amadurece. Como o produto depende inteiramente de uma lógica de orquestração aprendida, em vez de conjuntos de regras operacionais fixas, ele se beneficia automaticamente de inovações de terceiros. Sakana AI planeja expandir continuamente o conjunto disponível de agentes especializados.

A equipe de engenharia incluirá ferramentas de código aberto recém-lançadas e modelos proprietários de IA da Sakana no pool de roteamento assim que estiverem disponíveis. Os modelos padrão Fugu e Fugu Ultra estão disponíveis hoje para clientes empresariais.

Veja também: SAP e Google Cloud implantam arquitetura de comércio agente

Quer saber mais sobre IA e big data dos líderes do setor? Confira a AI & Big Data Expo que acontece em Amsterdã, Califórnia e Londres. O evento abrangente faz parte da TechEx e está localizado junto com outros eventos de tecnologia líderes, incluindo o Cyber Security & Cloud Expo. Clique aqui para mais informações.

AI News é desenvolvido pela TechForge Media. Explore outros eventos e webinars de tecnologia empresarial futuros aqui.

Fontesartificialintelligence

Mitigando a dependência do fornecedor com modelos multiagentes Sakana AI Fugu

ByRyan Daws

Níveis de implantação do Fugu

Implementação em segurança cibernética

Pesquisa automatizada e estabilidade de personalidade

Validação de benchmark estendida

By Ryan Daws

Leia Também

e2e-assure apresenta Cumulo, a única plataforma SOC soberana, orientada por IA e de dia zero do Reino Unido para proteger ambientes de TI e TO

SAP e Google Cloud implantam arquitetura de comércio agente

L’Oréal traz teste virtual da Maybelline para ChatGPT

Deixe um comentário Cancelar resposta

Leia Também:

e2e-assure apresenta Cumulo, a única plataforma SOC soberana, orientada por IA e de dia zero do Reino Unido para proteger ambientes de TI e TO

SAP e Google Cloud implantam arquitetura de comércio agente

L’Oréal traz teste virtual da Maybelline para ChatGPT

Mitigando a dependência do fornecedor com modelos multiagentes Sakana AI Fugu