O chip Nvidia Vera raramente é a manchete quando os lucros superam as estimativas, mas deveria ser. Quando a Nvidia relatou receitas do primeiro trimestre de US$ 81,62 bilhões na quarta-feira, superando as estimativas dos analistas de US$ 78,86 bilhões, e orientou o segundo trimestre em US$ 91 bilhões – bem acima da previsão de US$ 86,84 bilhões de Wall Street – os números fizeram o que os números da Nvidia sempre fazem: dominar a sala.

Mas enterrado na teleconferência do CEO Jensen Huang com analistas estava algo mais estrategicamente interessante do que outra batida trimestral. Huang disse aos analistas que os novos processadores centrais Vera da Nvidia desbloqueiam o acesso a um mercado de US$ 200 bilhões, um mercado que fica totalmente fora do US$ 1 trilhão que a empresa já previu para sua linha de GPUs Blackwell e Rubin AI entre 2025 e 2027.

Ele espera que a receita do chip Vera atinja US$ 20 bilhões até o final deste ano fiscal. “Espero que (Vera) seja o segundo maior” contribuidor de vendas, disse Huang durante a teleconferência.

Isso não é uma nota de rodapé. Essa é uma segunda frente.

O chip Vera e o pivô de inferência

A razão pela qual a Nvidia precisa de uma segunda frente é simples: seus maiores clientes estão construindo a sua própria. Google, Amazon e Microsoft – que deverão investir colectivamente mais de 700 mil milhões de dólares em infra-estruturas de IA este ano, um aumento acentuado em relação aos cerca de 400 mil milhões de dólares em 2025 – estão simultaneamente a investir fundos em silício personalizado para executar modelos de IA. A Intel e a AMD também estão promovendo as CPUs como uma peça confiável para cargas de trabalho de inferência.

A narrativa na indústria de chips mudou de quem pode treinar o maior modelo para quem pode atendê-lo de maneira mais barata e rápida. A inferência é onde o domínio da GPU da Nvidia está mais exposto. O treinamento de grandes modelos ainda é território firme da Nvidia, mas a inferência, gerando respostas em escala, em tempo real, é cada vez mais onde os chips personalizados da linha TPU do Google, Trainium da Amazon e outros estão defendendo.

A resposta da Nvidia é Vera. O chip, desenvolvido em parte usando tecnologia da Groq, uma startup especializada em inferência que a Nvidia licenciou em um acordo supostamente avaliado em cerca de US$ 17 bilhões, tem como alvo exatamente essa carga de trabalho. A plataforma Vera Rubin completa, que combina a CPU Vera com GPUs Rubin, está prevista para ser lançada ainda este ano.

A oferta já é a restrição

Huang foi sincero sobre um problema: o abastecimento. “Minha sensação é que teremos restrições de oferta durante toda a vida de Vera Rubin”, disse ele na teleconferência. É uma admissão reveladora de um produto que a Nvidia está posicionando como um importante pilar de crescimento. Para se antecipar às interrupções, a Nvidia está investindo pesadamente na cadeia de suprimentos. A empresa divulgou que os seus compromissos de fornecimento aumentaram para 119 mil milhões de dólares no primeiro trimestre, acima dos 95,2 mil milhões de dólares do trimestre anterior, um salto significativo que reflecte tanto a confiança na procura como a ansiedade relativamente a uma crise global de chips de memória.

A Nvidia também anunciou um programa de recompra de ações de US$ 80 bilhões e aumentou seu dividendo trimestral em dinheiro para 25 centavos por ação, de 1 centavo, movimentos que sinalizam confiança financeira, mesmo com Huang alertando sobre o aperto na oferta.

A pergunta que os investidores estão fazendo

Apesar das batidas, as ações da Nvidia caíram 1,6% nas negociações prolongadas após os resultados. O analista da eMarketer Jacob Bourne capturou o clima: “A Nvidia apresentou outra batida, mas neste ponto isso está essencialmente precificado, pois continua batendo trimestre após trimestre. A questão persistente é se ela pode convencer os investidores de que o desenvolvimento da IA ​​tem durabilidade em 2027 e 2028, especialmente à medida que a narrativa muda para cargas de trabalho de inferência e silício concorrente do Google, Amazon, AMD e Intel.”

Huang recuou com seus próprios números. Ele apontou para um subsegmento crescente de clientes de nuvem específicos para IA, cujos gastos são agora aproximadamente iguais aos dos hiperescaladores, mas crescendo mais rápido trimestre após trimestre. “Deveríamos estar crescendo mais rápido do que o investimento em hiperescala”, disse ele.

O chip Vera é central nesse argumento. Se a cadeia de abastecimento coopera é uma questão totalmente diferente.

(Fonte da imagem: Redação da Nvidia)

Veja também: O acordo Nvidia H200 China sobreviveu à cúpula Trump-Xi – mas não da maneira que se esperava

Quer saber mais sobre IA e big data dos líderes do setor? Confira a AI & Big Data Expo que acontece em Amsterdã, Califórnia e Londres. O evento abrangente faz parte da TechEx e é realizado junto com outros eventos de tecnologia líderes. Clique aqui para mais informações.

AI News é desenvolvido pela TechForge Media. Explore outros eventos e webinars de tecnologia empresarial futuros aqui.

Fontesartificialintelligence

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *