Famoso iPhone, Sony Hacker afirma que os agentes de codificação de IA são um desastre esperando para acontecer

Em resumo

George Hotz, o hacker por trás do primeiro jailbreak do iPhone e do crack do PlayStation 3, publicou uma postagem no blog no domingo chamando a adoção do agente de codificação de IA como “um dos erros mais caros na história da área”.
Seu argumento principal: os profissionais de alto desempenho conseguem detectar resultados ruins dos agentes, mas os engenheiros mais fracos não conseguem — e são os engenheiros mais fracos que produzem dez vezes mais volume, degradando a qualidade média do código em escala.
A postagem chegou cinco dias depois que Andrej Karpathy se juntou à equipe de pré-treinamento da Anthropic com a visão oposta, marcando uma clara divisão entre engenheiros sérios sobre se os agentes de IA realmente funcionam.

George Hotz – o hacker que decifrou o iPhone pela primeira vez aos 17 anos e fez engenharia reversa no PlayStation 3 antes de a Sony processá-lo por isso – publicou um post no blog no domingo argumentando que a adoção em massa de agentes de codificação de IA terminará em desastre, ou pelo menos perto disso.

“Estou avisando agora: a adoção de agentes de IA no desenvolvimento de software será um dos erros mais caros da história da área”, escreveu Hotz. “Os agentes não conseguem programar e está demorando cada vez mais para perceber que não conseguem.”

“O resultado está quebrado, mas de uma forma que está ficando cada vez mais difícil de detectar. O que é exatamente o que você esperaria de um modelo estatístico cada vez mais preciso.”

A postagem, intitulada “The Eternal Sloptember”, chega cinco dias depois que Andrej Karpathy, um dos pesquisadores mais proeminentes de IA, se juntou à equipe de pré-treinamento da Anthropic com a visão explícita de que os agentes de IA já transformaram o desenvolvimento de software. Os dois homens representam agora pólos opostos de um debate que a indústria não resolveu – e ambos têm credibilidade real para defender uma posição.

Atualização pessoal: entrei na Anthropic. Acredito que os próximos anos na fronteira dos LLMs serão especialmente formativos. Estou muito animado para me juntar à equipe aqui e voltar à P&D. Continuo profundamente apaixonado pela educação e pretendo retomar meu trabalho nisso a tempo.

– Andrej Karpathy (@karpathy) 19 de maio de 2026

Hotz não chegou à sua conclusão do lado de fora. Ele passou seis meses usando agentes em projetos reais: partes do Tinygrad, sua estrutura de aprendizado profundo de código aberto e uma engenharia reversa completa de firmware de um chip USB-PCIe. “O agente antecipa todo o progresso”, escreve ele, e depois entrega a você o que descreve como uma alavanca de caça-níqueis – você a puxa e espera que o trabalho final seja concluído.

Isso nunca acontece.

Não é sobre ego

Hotz antecipa a resistência óbvia: um programador que define parte da sua identidade através do seu ofício resistiria naturalmente às ferramentas que ameaçam substituí-lo. Ele leva a objeção a sério e a rejeita quanto ao mérito.

“Pensei mais sobre a questão da preservação da auto-estima. O AFL do Google encontrou mais bugs do que LLMs e ninguém se sentiu assim. O Chess and Go está mais popular do que nunca”, escreveu Hotz. E ele está certo no sentido de que a IA do xadrez dominou os humanos durante décadas e o jogo só se tornou mais popular.

Então, sua preocupação não é ser substituído. É sobre o que acontece com a qualidade do código quando todos usam essas ferramentas ao mesmo tempo, especialmente quando a Big Tech e Wall Street pressionam constantemente pelo uso em massa dessas ferramentas.

“Quase acho que se trata de algum tipo de operação psicológica para vender agentes”, argumenta Hotz. “O medo da perda é uma das únicas maneiras de fazer com que as grandes empresas se movam. Embora eu ache que com esse medo elas estão cometendo um grande erro.”

Seu argumento central é organizacional. Os profissionais de alto desempenho têm ciclos de feedback suficientemente estreitos para detectar problemas gerados pelos agentes antes de serem enviados. Eles leem o código, identificam os erros e calibram quando confiar na ferramenta. “Os piores desempenhos não terão essa autoavaliação”, escreve ele – e são eles que usam os agentes para produzir 10 vezes a produção anterior. Em uma grande empresa, essa matemática produz algo específico: degradação mais rápida da qualidade média do código, mascarada pelo grande volume.

O resultado, argumenta ele, será “uma era de ouro para baldes e mais baldes de lixo e uma era das trevas para joias de qualidade”. Como exemplo concreto, ele aponta relatos de que a Apple está promovendo ferramentas de codificação de IA em toda a sua organização de engenharia e pergunta simplesmente: “Você acha que o macOS ficará melhor ou pior nos próximos 2 anos?”

Onde estão os acampamentos

Hotz agora se coloca no que chama de “campo LeCun/Marcus” – referindo-se a Yann LeCun, cientista-chefe de IA da Meta, e Gary Marcus, um cético de longa data do LLM. Ambos argumentaram que os modelos de linguagem são fundamentalmente sofisticados comparadores de padrões: eles podem imitar a distribuição do código existente, mas não podem raciocinar através de problemas genuinamente novos a partir dos primeiros princípios.

A codificação Vibe – que descreve o que você deseja em linguagem simples e permite que a IA gere a implementação – explodiu no ano passado, e os principais laboratórios posicionaram a codificação baseada em agente como um produto principal. A Microsoft transformou o GitHub Copilot em um sistema de agente completo em 2025, com o CEO Satya Nadella descrevendo-o como uma mudança no nível da plataforma comparável à mudança para a nuvem.

A resistência à posição de Hotz não é abstrata. Karpathy, que era cético em relação aos agentes no início de 2025, inverteu sua posição após o lançamento de novos modelos e se juntou à equipe de pré-treinamento da Anthropic em 19 de maio – cinco dias antes da publicação de Hotz. Ele descreveu os próximos anos na fronteira como “especialmente formativos”.

O CEO da Anthropic, Dario Amodei, disse em Davos que alguns engenheiros da Anthropic já pararam de escrever código sozinhos, permitindo que os modelos cuidem dele enquanto revisam o resultado. Hotz, por sua vez, diz que tentou fazer a mesma coisa e sempre procurava a correção manual.

Resumo Diário Boletim informativo

Comece cada dia com as principais notícias do momento, além de recursos originais, podcast, vídeos e muito mais.

Fontedecrypt

Famoso iPhone, Sony Hacker afirma que os agentes de codificação de IA são um desastre esperando para acontecer

ByJose Antonio Lanz

Em resumo

Resumo Diário Boletim informativo

By Jose Antonio Lanz

Leia Também

Estratégia vende US$ 467 milhões em ações MSTR, Bitcoin Stack Steady

CEO da Coinbase diz que as moedas de conteúdo da Base ‘não funcionaram’

Leilões Uniswap vão ao ar na rede Robinhood

Deixe um comentário Cancelar resposta

Leia Também:

Estratégia vende US$ 467 milhões em ações MSTR, Bitcoin Stack Steady

CEO da Coinbase diz que as moedas de conteúdo da Base ‘não funcionaram’

Leilões Uniswap vão ao ar na rede Robinhood

Sablier Labs entra em modo de manutenção e interrompe o desenvolvimento