Em resumo
- A OpenAI está considerando cortes significativos nos preços dos tokens em antecipação a movimentos semelhantes da Anthropic.
- A mudança surge no momento em que ambas as empresas correm em direção a duelos de IPOs.
- Os provedores de inferência de código aberto já estão servindo o DeepSeek V4 por uma fração do preço do modelo fechado, dando aos clientes corporativos uma saída viável antes mesmo de qualquer guerra de preços começar.
A OpenAI está considerando reduzir os preços que cobra de desenvolvedores e empresas, de acordo com o Wall Street Journal, em antecipação a cortes semelhantes da Anthropic. As discussões são descritas como ainda em andamento, já que ambas as empresas entraram com pedido confidencial de IPOs este mês, e nenhuma obteve lucro.
“Acho que teremos muitas maneiras de ajudar as pessoas a obter mais valor com menos gastos”, disse Sam Altman em um evento recente, de acordo com o Jornal de Wall Street. Essa cotação ocorreu em um cenário em que a OpenAI postou uma margem operacional ajustada de -122% no primeiro trimestre de 2026 – o que significa que perdeu US$ 1,22 para cada dólar arrecadado.
A pressão é real. Como Descriptografar relatado anteriormente, a participação do ChatGPT no tráfego global de IA generativa da web caiu de 77,6% em maio de 2025 para 53,7% em abril de 2026. Pela primeira vez, mais empresas rastreadas pelo Ramp AI Index estão pagando pelo Anthropic do que pelo OpenAI. A taxa de execução anualizada da Anthropic passou de US$ 9 bilhões no final de 2025 para US$ 47 bilhões em maio de 2026 – um salto de 422% em cinco meses – impulsionada quase inteiramente por Claude Code, sendo o segundo trimestre de 2026 o primeiro trimestre lucrativo da empresa.
Desde então, a OpenAI tornou sua própria ferramenta de codificação, Codex, uma prioridade da empresa. Mas está tentando se atualizar.
Ambas as empresas estão travando uma guerra não tão silenciosa para atrair o maior número possível de clientes em meio à maior febre tecnológica do mundo desde a era pontocom. Empresas de todos os tipos estão agora correndo para usar a IA de uma forma ou de outra. O CTO da Uber queimou todo o seu orçamento de IA para 2026 até abril, alguns funcionários do JP Morgan estão gastando mais no uso de IA do que em seu próprio salário, de acordo com o diretor de dados do banco para sua divisão de pagamentos.
Esta é a prática que o Vale do Silício adotou para chamar de “tokenmaxxing” – queimar tantos tokens de IA – os bits de dados processados por modelos de IA – quanto possível, muitas vezes sem um retorno claro do investimento. O CEO da Palantir, Alex Karp, comparou isso a um vício em pornografia na AIPCon na semana passada. Os analistas do JP Morgan publicaram uma nota este mês intitulada “As contas de IA estão fora de controle”. As empresas mais expostas ao revés são as que agora contemplam uma guerra de preços.
Tommy Shaughnessy, da Delphi Ventures, expôs a armadilha estrutural em uma postagem X amplamente compartilhada esta semana: A taxa fixa de US$ 20/mês sempre teve um preço abaixo do que o uso pesado realmente custa – um líder em perdas projetado para impulsionar a adoção, não cobrir a computação. Quando uma empresa real precisa de IA em escala, ela migra para a API, pagando por token, mas consumindo muito mais poder computacional.
Nem todo mundo concorda com essa opinião. Alguns acreditam que o oligopólio da IA no hemisfério ocidental permite que as empresas cobrem preços cada vez mais elevados pelo processamento das suas solicitações – sendo a prova disso os modelos chineses que cobram tão pouco. Se for esse o caso, pode haver espaço para mudanças drásticas de preços, embora ainda exista uma base financeira sólida.
Hot take: Eles não são subsidiados, suas margens são absurdas. Eles estão estuprando absolutamente os clientes da API. Qualquer pessoa que tenha usado deepseek ou hospedado qualquer coisa e feito as contas dos custos de hardware/energia sabe disso https://t.co/XQ477Qw3Vv
-Roy (@usr_bin_roygbiv) 11 de junho de 2026
As implantações empresariais reais estão migrando para preços medidos de API, e as empresas estão queimando créditos muito mais rápido do que as taxas fixas já sugeridas. Enquanto isso, os provedores de inferência de código aberto (empresas que fornecem poder computacional para que os modelos de IA possam processar informações) estão crescendo rapidamente, com as ferramentas de agente sendo o catalisador para seu crescimento. Estas plataformas servem os principais modelos de IA da China, como DeepSeek, GLM, MiMo, Kimi ou Minimax, que competem com Claude Opus em benchmarks de codificação, a um preço aproximadamente um décimo terceiro o preço da alternativa fechada.
“Modelos de nível de fronteira de código aberto de laboratórios chineses”, escreveu Shaughnessy. “O modelo é o maior custo que um provedor de inferência tem, e eles o obtêm de graça”. Enquanto isso se mantiver, o piso do preço da inteligência continuará caindo para zero – e qualquer recuperação de margem na OpenAI ou na Anthropic se tornará um problema matemático sem solução limpa.
Toda a tese só será interrompida se a China fechar o código-fonte, observou Shaughnessy, o que seria otimista para os laboratórios dos EUA.
Até agora, a maioria dos laboratórios de IA da China parece comprometida com a abordagem oposta.
Resumo Diário Boletim informativo
Comece cada dia com as principais notícias do momento, além de recursos originais, podcast, vídeos e muito mais.
Fontedecrypt




