Decrypt logoImage: Decrypt

Em resumo

  • O sistema usou o modelo Gemini do Google para raciocinar sobre objetivos, explicar seus planos e agir em jogos desconhecidos.
  • SIMA 2 aprendeu novas habilidades por meio de jogo autodirigido e adaptou-se aos mundos criados momentos antes pelo Genie 3.
  • A DeepMind planejou uma prévia limitada da pesquisa para desenvolvedores e acadêmicos.

O Google DeepMind apresentou o SIMA 2 na quinta-feira – um novo agente de IA que a empresa afirma se comportar como um “companheiro” dentro de mundos virtuais. Com o lançamento do SIMA 2, a DeepMind pretende avançar além das simples ações na tela e avançar em direção à IA que pode planejar, explicar-se e aprender através da experiência.

“Este é um passo significativo na direção da Inteligência Artificial Geral (AGI), com implicações importantes para o futuro da robótica e da incorporação da IA ​​em geral”, afirmou a empresa em seu site.

A primeira versão do SIMA (Scalable Instructable Multiworld Agent), lançada em março de 2024, aprendeu centenas de habilidades básicas observando a tela e usando controles virtuais de teclado e mouse. A nova versão do SIMA, disse o Google, vai um passo além, deixando a IA pensar por si mesma.

“SIMA 2 é nosso agente de IA mais capaz para mundos virtuais 3D”, escreveu o Google DeepMind no X. “Desenvolvido pelo Gemini, ele vai além de seguir instruções básicas para pensar, compreender e realizar ações em ambientes interativos – o que significa que você pode conversar com ele por meio de texto, voz ou até mesmo imagens.”

Ao usar o modelo Gemini AI, o Google disse que o SIMA pode interpretar objetivos de alto nível, falar sobre as etapas que pretende seguir e colaborar dentro dos jogos com um nível de raciocínio que o sistema original não poderia alcançar.

DeepMind relatou uma generalização mais forte em ambientes virtuais e que o SIMA 2 completou tarefas mais longas e complexas, que incluíam prompts lógicos, esboços desenhados na tela e emojis.

“Como resultado desta capacidade, o desempenho do SIMA 2 é significativamente mais próximo do de um jogador humano numa ampla gama de tarefas”, escreveu o Google, observando que o SIMA 2 teve uma taxa de conclusão de tarefas de 65%, em comparação com 31% do SIMA 1.

O sistema também interpretou instruções e agiu dentro de mundos 3D inteiramente novos gerados pelo Genie 3, outro projeto da DeepMind lançado no ano passado que cria ambientes interativos a partir de uma única imagem ou prompt de texto. O SIMA 2 orientou-se, compreendeu os objetivos e realizou ações significativas em mundos que nunca havia encontrado até momentos antes do teste.

“O SIMA 2 é agora muito melhor na execução de instruções detalhadas, mesmo em mundos nunca vistos antes”, escreveu o Google. “Ele pode transferir conceitos aprendidos como ‘mineração’ em um jogo e aplicá-los à ‘colheita’ em outro – conectando os pontos entre tarefas semelhantes.”

Depois de aprender com as demonstrações humanas, os pesquisadores disseram que o agente mudou para o jogo autodirigido, usando tentativa e erro e feedback gerado pelo Gemini para criar novos dados de experiência, incluindo um ciclo de treinamento onde o SIMA 2 gerou tarefas, tentou-as e depois alimentou seus próprios dados de trajetória de volta para a próxima versão do modelo.

Embora o Google tenha saudado o SIMA 2 como um avanço para a inteligência artificial, a pesquisa também identificou lacunas que ainda precisam ser abordadas, incluindo dificuldades com tarefas muito longas e de várias etapas, trabalhar dentro de uma janela de memória limitada e enfrentar desafios de interpretação visual comuns aos sistemas de IA 3D.

Mesmo assim, DeepMind disse que a plataforma serviu como um teste para habilidades que poderiam eventualmente migrar para robótica e navegação.

“Nossa pesquisa SIMA 2 oferece um forte caminho para aplicações em robótica e mais um passo em direção à AGI no mundo real”, afirmou.

GG Boletim informativo

Receba as últimas notícias sobre jogos da web3, ouça diretamente os estúdios de jogos e influenciadores que cobrem o espaço e receba power-ups de nossos parceiros.



Fontedecrypt

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *