Elon Musk and Sam Altman. Photos: Wikimedia and Sam Altman, edited by Decrypt using AI

O modelo OpenAi O3 de Sam Altman-que foi obsoleto no final da semana passada com o lançamento do GPT-5-distribuiu o Elon Musk’s Grok 4 em quatro jogos seguidos na quinta-feira para vencer a exposição de xadrez da Arena Kaggle Arena do Google.

Você pode pensar que era um espetáculo super complexo de gigantes de alta tecnologia colocando seu raciocínio ao teste final, mas como aperitivo, digamos que o campeão do mundo Magnus Carlsen comparou os dois bots com “um garoto talentoso que não sabe como as peças se movem”.

Captura de tela do suporte do torneio de xadrez da IA.

O torneio de três dias, que foi de 5 a 7 de agosto, forçou os chatbots de uso geral-sim, os mesmos que ajudam a escrever e-mails e afirmar que estão se aproximando da inteligência em nível humano-para jogar xadrez sem nenhum treinamento especializado. Sem motores de xadrez, sem movimentos, apenas qualquer conhecimento de xadrez que eles absorveram aleatoriamente da Internet.

Os resultados foram tão elegantes quanto você esperaria de forçar um modelo de idioma a jogar um jogo de tabuleiro. Carlsen, que co-concordou a final, estimou que ambos os AIS estavam jogando no nível de jogadores casuais que recentemente aprenderam as regras-em 800 ELO. Por contexto, ele é sem dúvida o melhor jogador de xadrez que já viveu, com um ELO de 2839 pontos. Essas AIs estavam jogando como se tivessem aprendido xadrez com um PDF corrompido.

“Eles oscilam entre jogadas muito, muito boas e sequências incompreensíveis”, disse Carlsen durante uma transmissão, após o jogo. A certa altura, depois de assistir Grok entrar em seu rei diretamente em perigo, ele brincou que poderia pensar que eles estavam interpretando o rei da colina em vez de xadrez.

Os jogos reais eram como uma masterclass em como não jogar xadrez, mesmo para aqueles que não conhecem o jogo. Na primeira partida, Grok deu essencialmente uma de suas peças importantes de graça e depois piorou as coisas trocando mais peças enquanto já está atrasado.

O segundo jogo ficou ainda mais estranho. Grok tentou executar o que os jogadores de xadrez chamam de “peão envenenado” – uma estratégia arriscada, mas legítima, onde você pega um peão inimigo que parece livre, mas não é. Exceto que Grok pegou o peão errado completamente, um que foi obviamente defendido. Sua rainha (a peça mais poderosa do quadro) ficou presa e capturada imediatamente.

No jogo três, Grok havia construído o que parecia uma posição sólida – bom controle posicional, sem perigos óbvios e basicamente uma configuração que pode ajudá -lo a vencer a partida. Então, no meio do jogo, basicamente atrapalhou a bola diretamente para o oponente. Perdeu a peça após peça em rápida sucessão.

Na verdade, isso era estranho, considerando que antes da partida contra a O3, Grok era um candidato bastante forte, mostrando um potencial sólido – tanto que o grande mestre do xadrez Hikaru Nakamura o elogiou. “Grok é facilmente o melhor até agora, apenas sendo objetivo, facilmente o melhor.”

O quarto (e último) jogo forneceu o único suspense genuíno. O Open’s O3 fez um erro enorme no início do jogo, que é um grande perigo em qualquer partida razoável. Nakamura, que estava transmitindo a partida, disse que ainda havia “alguns truques” para a O3, apesar da desvantagem.

Ele estava certo – O3 recuou para reconquistar sua rainha de volta e lentamente espremeu uma vitória, enquanto o jogo do jogo final de Grok se desfez como um papelão molhado.

“Grok cometeu tantos erros nesses jogos, mas o Openai não”, disse Nakamura durante sua transmissão ao vivo. Esta foi a reversão do início da semana.

O momento não poderia ter sido pior para Elon Musk. Após as fortes rodadas de Grok, ele postou em X que as habilidades de xadrez de sua IA eram apenas um “efeito colateral” e que Xai “não gastou quase nenhum esforço no xadrez”. Isso acabou sendo um eufemismo.

Antes desse torneio de xadrez “oficial”, o mestre internacional Levy Rozman sediou seu próprio torneio no início deste ano com modelos menos avançados. Ele respeitou todos os movimentos que os chatbots recomendam, e toda a situação acabou sendo uma bagunça completa com movimentos ilegais, convocação de peças e cálculos incorretos. O Stockfish, uma IA construída especificamente para xadrez, acabou vencendo o torneio contra o ChatGPT. A IA de Altman foi combinada contra Musk nas semifinais e Grok Lost. Então é 2-0 para Sam.

No entanto, este torneio foi diferente. Cada bot teve quatro chances de fazer uma jogada legal – se falhassem quatro vezes, perderam automaticamente. Isso não foi hipotético. Nas primeiras rodadas, a AIS tentou teletransportar peças em geral, trazer peças mortas de volta à vida e mover peões para o lado como se estivessem tocando uma versão do xadrez com febre que eles se inventaram.

Eles foram desqualificados.

Os Gêmeos do Google conquistaram o terceiro lugar ao vencer outro modelo Openai, recuperando alguma dignidade para os organizadores do torneio. Aquela partida de medalha de bronze apresentou um jogo particularmente absurdo, onde ambos os AIS tinham posições completamente vencendo em pontos diferentes, mas não conseguiam descobrir como terminar.

Carlsen apontou que os AIs eram melhores na contagem de peças capturadas do que na verdade entregando o Checkmate – eles entenderam a vantagem material, mas não como vencer. É como ser ótimo em coletar ingredientes, mas incapaz de cozinhar uma refeição.

Esses são os mesmos modelos de IA que os executivos de tecnologia afirmam estar se aproximando da inteligência humana, ameaçando empregos de colarinho branco e revolucionando como trabalhamos. No entanto, eles não podem jogar um jogo de tabuleiro que existe há 1.500 anos sem tentar trapacear ou esquecer as regras.

Portanto, é provavelmente seguro dizer que estamos seguros, a IA não assumirá o controle da humanidade, por enquanto.

Geralmente inteligente Boletim informativo

Uma jornada semanal de IA narrada por Gen, um modelo generativo de IA.

Fontedecrypt

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *