Apple logo. Image: Apple/Decrypt

Em resumo

  • O CEO da Apple, Tim Cook, alertou que o Mac mini e o Mac Studio podem permanecer em falta por “vários meses” depois que a demanda impulsionada pela IA exceder em muito as previsões da empresa.
  • OpenClaw – a plataforma de agente de IA de código aberto agora apoiada pela OpenAI – transformou a arquitetura de memória unificada da Apple no hardware padrão para executar grandes modelos locais de IA.
  • O M4 Ultra da Apple suporta até 192 GB de memória unificada, permitindo que os desenvolvedores executem modelos que não cabem em nenhuma GPU Nvidia de consumidor único, que atinge no máximo 32 GB de VRAM.

O Mac mini da Apple sempre foi o desktop silencioso e esquecível na parte de trás da Apple Store. Prático, barato para os padrões da Apple e amplamente ignorado pela turma da IA. Então o OpenClaw aconteceu.

Na quinta-feira, Tim Cook disse aos analistas que o Mac mini e o Mac Studio estão esgotados – e podem permanecer assim por vários meses. “Ambas são plataformas incríveis para IA e ferramentas de agência”, disse ele na teleconferência de resultados do segundo trimestre de 2026 da Apple, “e o reconhecimento disso pelo cliente está acontecendo mais rápido do que havíamos previsto”.

Tradução: a Apple calculou mal o quanto os desenvolvedores gostariam dessas máquinas, especialmente em tempos em que a escassez está atrapalhando os mercados.

A receita do Mac foi de US$ 8,4 bilhões no trimestre, um aumento de 6% ano a ano. Não é exatamente uma explosão – mas as restrições de oferta, e não a procura, são o fator limitante. As configurações do Mac mini e Mac Studio com alta RAM não são apenas atrasadas; alguns foram totalmente retirados da Apple Store.

O Mac mini básico de US$ 599 está esgotado nos EUA, sem entrega ou retirada na loja disponível. Configurações atualizadas com 64 GB de RAM apresentam tempos de espera de 16 a 18 semanas. Os modelos Mac Studio com 512 GB de memória unificada desapareceram completamente da loja. Os cambistas no eBay se popularizaram rapidamente, listando modelos básicos quase o dobro do varejo.

O catalisador de tudo isso? OpenClaw e o boom da Agentic AI, que consome muita memória.

A estrutura de agente de IA de código aberto – construída por Peter Steinberger e agora apoiada pela OpenAI após uma guerra de licitações com Meta – explodiu para mais de 323.000 estrelas do GitHub e se tornou a maneira mais rápida para indivíduos e pequenas equipes executarem localmente agentes de IA persistentes. E o hardware de referência não oficial para executá-lo tornou-se, quase imediatamente, o Mac mini.

Porém, não foi o resultado de um impulso de marketing.

O que a maioria das pessoas que cobrem a falta de Mac não percebe é que a Apple foi irrelevante para cargas de trabalho sérias de IA durante anos. Antes que o milagre dos Agentes de IA se tornasse popular, as pessoas reclamavam que a execução de LLMs, Difusão Estável de qualquer outro tipo de software doméstico de IA era extremamente lenta e quase inutilizável. Um Mac M2 tinha um desempenho comparável a uma GPU de 2019. A recusa da Apple em adotar CUDA ou usar Nvidia, pressionando por sua tecnologia MLX, tornou-a tão irrelevante para IA quanto para jogos.

A Nvidia decidiu porque CUDA – sua estrutura de programação de GPU proprietária – era a espinha dorsal do treinamento e inferência de modelos. Toda a pilha de IA foi construída em torno disso. A Apple não tinha nada comparável. Ninguém queria um Mac para inferência local.

Mas CUDA tem um segredo sujo: limites de VRAM.

Mesmo a melhor GPU Nvidia de consumo, a RTX 5090, chega a 32 GB de VRAM. Esse é um teto rígido. Um modelo maior que 32 GB não pode funcionar em velocidade total nessa placa – ele se espalha pela RAM mais lenta do sistema, rasteja pelo barramento PCIe e prejudica o desempenho. Para executar um modelo sério de 70 bilhões de parâmetros em hardware Nvidia, você precisa de várias GPUs, um rack de servidor, grande consumo de energia e milhares de dólares.

A Arquitetura de Memória Unificada (UMA) da Apple resolve isso de uma forma que o CUDA não consegue. No Apple Silicon, a CPU, a GPU e o Neural Engine compartilham o mesmo pool físico de RAM. Não há VRAM separado. Não há barramento PCIe para cruzar. Um Mac mini com 64 GB pode carregar um modelo de 70 bilhões de parâmetros que um RTX 5090 de US$ 1.800 simplesmente se recusa a tocar.

O M4 Ultra – o chip que alimenta configurações Mac Studio de última geração – suporta até 192 GB de memória unificada. Isso é suficiente para executar 100 bilhões de modelos de parâmetros localmente em uma única máquina. Nenhum servidor. Nenhuma conta mensal de nuvem.

O OpenClaw tornou essa compensação óbvia. Como ele executa agentes localmente – conectando-se aos seus arquivos, aplicativos, mensagens – os usuários precisavam de máquinas que pudessem lidar com a carga de raciocínio sem alugar computação da nuvem. Um Mac mini com 32 GB de memória unificada executa confortavelmente modelos com parâmetros de 30B. Um Mac Studio com 128 GB lida com modelos que a maioria dos desenvolvedores não conseguiria sem um cluster de GPU empresarial há um ano.

Um Mac lento, capaz de executar um modelo de IA poderoso, é muito melhor do que uma placa Nvidia poderosa, incapaz de carregar esse modelo.

O resultado: os desenvolvedores começaram a comprar Mac minis da mesma forma que compravam Raspberry Pis: várias unidades ao mesmo tempo, tratadas como infraestrutura e não como computadores pessoais. A cadeia de suprimentos da Apple nunca foi projetada para esse padrão.

Há também uma escassez mais ampla de memória que agrava o problema. A IDC espera que as remessas globais de PCs diminuam 11,3% em 2026, em parte devido à escassez de chips de memória alimentada pela demanda de servidores de IA. A Apple agora está competindo pelo mesmo fornecimento de RAM que os hiperescaladores que constroem data centers.

Cook disse que pode levar “vários meses” para equilibrar a oferta e a demanda no Mac mini e no Studio. Uma atualização do chip M5 é esperada no final de 2026, o que pode aliviar a pressão – mas os compradores atuais estão esperando ou pagando preços cambistas.

O Mac mini gerou mais urgência em 2026 do que em qualquer momento de seus 20 anos de história – e tudo o que precisava era da ajuda de um projeto de código aberto com o qual a Apple não tinha absolutamente nada a ver para que isso acontecesse.

Resumo Diário Boletim informativo

Comece cada dia com as principais notícias do momento, além de recursos originais, podcast, vídeos e muito mais.

Fontedecrypt

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *