A estratégia de chip de agente de IA do Alibaba vai além da Nvidia

A Alibaba revelou um novo processador de IA construído especificamente para agentes de IA, combinando o anúncio do chip com um roteiro plurianual de silício e um novo modelo de linguagem grande, sinalizando que a empresa está construindo uma pilha de IA integrada em vez de apenas preencher uma lacuna deixada pelos controles de exportação dos EUA.

O Zhenwu M890, desenvolvido pela T-Head, subsidiária de semicondutores do Alibaba, oferece três vezes o desempenho de seu antecessor, o Zhenwu 810E, segundo a empresa, conforme Reuters relatório. Mas o salto no desempenho é menos notável do que a intenção arquitetônica por trás do chip: o M890 foi desenvolvido especificamente para agentes de IA, onde os sistemas de software devem reter longos trechos de contexto, coordenar-se com outros modelos em tempo real e executar tarefas complexas de várias etapas com intervenção humana limitada.

Essas demandas, pesadas em largura de banda de memória e comunicação entre modelos, são significativamente diferentes daquelas para as quais os chips de inferência padrão são otimizados. A diferença é importante porque diz algo sobre o rumo que o Alibaba pensa que a computação de IA está tomando. A empresa não está projetando em torno do caso de uso dominante atual; está construindo o perfil de carga de trabalho que espera definir a IA corporativa nos próximos anos.

Criado para agentes de IA, não apenas para inferência

Mais significativo do que o chip em si é o roteiro que o Alibaba colocou ao lado dele. O M890 será seguido pelo V900 no terceiro trimestre de 2027, com expectativa de entregar outro ganho de desempenho aproximadamente triplo, seguido pelo J900 no terceiro trimestre de 2028. Essa é uma cadência deliberada e sustentada de atualizações internas de silício que reflete o tipo de ciclos de produto tick-tock que a Nvidia usou para manter sua liderança em aceleradores de IA.

Vale a pena notar o paralelo com a Huawei. A Huawei apresentou um roteiro de chips semelhante para a sua linha Ascend no ano passado, e ambos os anúncios reflectem a mesma realidade subjacente: as empresas tecnológicas chinesas concluíram que depender do silício estrangeiro, mesmo em cenários em que as restrições à exportação possam diminuir, é um risco estrutural que não podem aceitar. A resposta tem sido tratar o desenvolvimento de semicondutores como um exercício de desenvolvimento de capacidades a longo prazo e não como um problema de aquisição.

O compromisso do Alibaba com esse exercício não é superficial. A empresa prometeu mais de 380 mil milhões de yuans, cerca de 53 mil milhões de dólares, em infraestruturas de nuvem e IA ao longo de três anos no ano passado, o seu maior compromisso de investimento de sempre no setor. O M890 e seus sucessores estão a jusante desses gastos.

Tração que antecede o anúncio

A T-Head disse que já despachou mais de 560.000 unidades Zhenwu até o momento, com mais de 400 clientes externos em 20 setores implantando os chips, incluindo montadoras e empresas de serviços financeiros. Essa é uma pegada de produção material, não de hardware de laboratório, e fornece ao Alibaba dados de implantação do mundo real em escala antes do lançamento do M890.

O novo chip estará disponível para clientes empresariais chineses através da plataforma de modelo doméstico da Alibaba Cloud, Bailian, empacotada dentro do Panjiu AL128, um sistema de servidor que empilha 128 aceleradores M890 em um único rack.

O lado do software da pilha

Juntamente com o hardware, a Alibaba anunciou o Qwen 3.7-Max, a versão mais recente de seu principal modelo de linguagem grande, descrito como projetado para codificação avançada e tarefas de agente de longa duração. A empresa disse que o modelo pode operar continuamente por até 35 horas sem degradação de desempenho, uma especificação de capacidade que só faz sentido se você estiver projetando para operação autônoma prolongada.

O momento é deliberado. Lançar um chip e um modelo otimizado para a mesma classe de carga de trabalho no mesmo dia é uma brincadeira de plataforma. A Alibaba está construindo um circuito fechado: seu próprio silício em T-Head, seu próprio modelo em Qwen, sua própria entrega em nuvem em Bailian. Cada componente reforça os outros, e a pilha combinada é projetada para reduzir a dependência dos clientes empresariais de qualquer fornecedor externo.

Mais de meio milhão de chips foram enviados. Um sucessor chegará em 2027, com outro planejado para 2028. A T-Head não está fazendo hedge. A dada altura, construir em torno dos controlos de exportação dos EUA deixa de ser uma solução alternativa e passa a ser uma estratégia. O Alibaba parece ter cruzado essa linha.

(Fonte da imagem: A Casa Branca)

Veja também: Alibaba Qwen está desafiando a economia do modelo proprietário de IA

Quer saber mais sobre IA e big data dos líderes do setor? Confira a AI & Big Data Expo que acontece em Amsterdã, Califórnia e Londres. O evento abrangente faz parte da TechEx e é realizado junto com outros eventos de tecnologia líderes. Clique aqui para mais informações.

AI News é desenvolvido pela TechForge Media. Explore outros eventos e webinars de tecnologia empresarial futuros aqui.

Fontesartificialintelligence

A estratégia de chip de agente de IA do Alibaba vai além da Nvidia

ByDashveenjit Kaur

Criado para agentes de IA, não apenas para inferência

Tração que antecede o anúncio

O lado do software da pilha

By Dashveenjit Kaur

Leia Também

Ethereum x Bitcoin: a recuperação de 5% da ETH no terceiro trimestre é o início de uma rotação estrutural?

PEPE recupera 26% em julho – Os traders devem esperar mais vantagens?

‘Precificado’ – Metaplanet lança estudo sobre crédito digital apoiado por Bitcoin

Deixe um comentário Cancelar resposta

Leia Também:

Ethereum x Bitcoin: a recuperação de 5% da ETH no terceiro trimestre é o início de uma rotação estrutural?

PEPE recupera 26% em julho – Os traders devem esperar mais vantagens?

‘Precificado’ – Metaplanet lança estudo sobre crédito digital apoiado por Bitcoin

Previsão de preço da Ethena: A zona de US$ 0,08 manterá viva a recuperação da ENA?