Em resumo
- George Hotz, o hacker por trás do primeiro jailbreak do iPhone e do crack do PlayStation 3, publicou uma postagem no blog no domingo chamando a adoção do agente de codificação de IA como “um dos erros mais caros na história da área”.
- Seu argumento principal: os profissionais de alto desempenho conseguem detectar resultados ruins dos agentes, mas os engenheiros mais fracos não conseguem — e são os engenheiros mais fracos que produzem dez vezes mais volume, degradando a qualidade média do código em escala.
- A postagem chegou cinco dias depois que Andrej Karpathy se juntou à equipe de pré-treinamento da Anthropic com a visão oposta, marcando uma clara divisão entre engenheiros sérios sobre se os agentes de IA realmente funcionam.
George Hotz – o hacker que decifrou o iPhone pela primeira vez aos 17 anos e fez engenharia reversa no PlayStation 3 antes de a Sony processá-lo por isso – publicou um post no blog no domingo argumentando que a adoção em massa de agentes de codificação de IA terminará em desastre, ou pelo menos perto disso.
“Estou avisando agora: a adoção de agentes de IA no desenvolvimento de software será um dos erros mais caros da história da área”, escreveu Hotz. “Os agentes não conseguem programar e está demorando cada vez mais para perceber que não conseguem.”
“O resultado está quebrado, mas de uma forma que está ficando cada vez mais difícil de detectar. O que é exatamente o que você esperaria de um modelo estatístico cada vez mais preciso.”
A postagem, intitulada “The Eternal Sloptember”, chega cinco dias depois que Andrej Karpathy, um dos pesquisadores mais proeminentes de IA, se juntou à equipe de pré-treinamento da Anthropic com a visão explícita de que os agentes de IA já transformaram o desenvolvimento de software. Os dois homens representam agora pólos opostos de um debate que a indústria não resolveu – e ambos têm credibilidade real para defender uma posição.
Atualização pessoal: entrei na Anthropic. Acredito que os próximos anos na fronteira dos LLMs serão especialmente formativos. Estou muito animado para me juntar à equipe aqui e voltar à P&D. Continuo profundamente apaixonado pela educação e pretendo retomar meu trabalho nisso a tempo.
– Andrej Karpathy (@karpathy) 19 de maio de 2026
Hotz não chegou à sua conclusão do lado de fora. Ele passou seis meses usando agentes em projetos reais: partes do Tinygrad, sua estrutura de aprendizado profundo de código aberto e uma engenharia reversa completa de firmware de um chip USB-PCIe. “O agente antecipa todo o progresso”, escreve ele, e depois entrega a você o que descreve como uma alavanca de caça-níqueis – você a puxa e espera que o trabalho final seja concluído.
Isso nunca acontece.
Não é sobre ego
Hotz antecipa a resistência óbvia: um programador que define parte da sua identidade através do seu ofício resistiria naturalmente às ferramentas que ameaçam substituí-lo. Ele leva a objeção a sério e a rejeita quanto ao mérito.
“Pensei mais sobre a questão da preservação da auto-estima. O AFL do Google encontrou mais bugs do que LLMs e ninguém se sentiu assim. O Chess and Go está mais popular do que nunca”, escreveu Hotz. E ele está certo no sentido de que a IA do xadrez dominou os humanos durante décadas e o jogo só se tornou mais popular.
Então, sua preocupação não é ser substituído. É sobre o que acontece com a qualidade do código quando todos usam essas ferramentas ao mesmo tempo, especialmente quando a Big Tech e Wall Street pressionam constantemente pelo uso em massa dessas ferramentas.
“Quase acho que se trata de algum tipo de operação psicológica para vender agentes”, argumenta Hotz. “O medo da perda é uma das únicas maneiras de fazer com que as grandes empresas se movam. Embora eu ache que com esse medo elas estão cometendo um grande erro.”
Seu argumento central é organizacional. Os profissionais de alto desempenho têm ciclos de feedback suficientemente estreitos para detectar problemas gerados pelos agentes antes de serem enviados. Eles leem o código, identificam os erros e calibram quando confiar na ferramenta. “Os piores desempenhos não terão essa autoavaliação”, escreve ele – e são eles que usam os agentes para produzir 10 vezes a produção anterior. Em uma grande empresa, essa matemática produz algo específico: degradação mais rápida da qualidade média do código, mascarada pelo grande volume.
O resultado, argumenta ele, será “uma era de ouro para baldes e mais baldes de lixo e uma era das trevas para joias de qualidade”. Como exemplo concreto, ele aponta relatos de que a Apple está promovendo ferramentas de codificação de IA em toda a sua organização de engenharia e pergunta simplesmente: “Você acha que o macOS ficará melhor ou pior nos próximos 2 anos?”
Onde estão os acampamentos
Hotz agora se coloca no que chama de “campo LeCun/Marcus” – referindo-se a Yann LeCun, cientista-chefe de IA da Meta, e Gary Marcus, um cético de longa data do LLM. Ambos argumentaram que os modelos de linguagem são fundamentalmente sofisticados comparadores de padrões: eles podem imitar a distribuição do código existente, mas não podem raciocinar através de problemas genuinamente novos a partir dos primeiros princípios.
A codificação Vibe – que descreve o que você deseja em linguagem simples e permite que a IA gere a implementação – explodiu no ano passado, e os principais laboratórios posicionaram a codificação baseada em agente como um produto principal. A Microsoft transformou o GitHub Copilot em um sistema de agente completo em 2025, com o CEO Satya Nadella descrevendo-o como uma mudança no nível da plataforma comparável à mudança para a nuvem.
A resistência à posição de Hotz não é abstrata. Karpathy, que era cético em relação aos agentes no início de 2025, inverteu sua posição após o lançamento de novos modelos e se juntou à equipe de pré-treinamento da Anthropic em 19 de maio – cinco dias antes da publicação de Hotz. Ele descreveu os próximos anos na fronteira como “especialmente formativos”.
O CEO da Anthropic, Dario Amodei, disse em Davos que alguns engenheiros da Anthropic já pararam de escrever código sozinhos, permitindo que os modelos cuidem dele enquanto revisam o resultado. Hotz, por sua vez, diz que tentou fazer a mesma coisa e sempre procurava a correção manual.
Resumo Diário Boletim informativo
Comece cada dia com as principais notícias do momento, além de recursos originais, podcast, vídeos e muito mais.
Fontedecrypt




