(Perguntei a Shah se eles estavam considerando algum cenário de pior caso, mais no extremo do espectro, como o colapso econômico generalizado. “Certamente não, se estivermos conversando até o final do ano”, disse ele. Faltam apenas seis meses! Ele riu. “Ok, um pouco depois disso.”)
Shah e Fox acham que a única maneira de entender o que pode acontecer quando um grande número de sistemas multiagentes interage entre si é executar simulações realistas. Eles querem que os pesquisadores coloquem agentes de IA em sandboxes e estudem o que eles fazem.
Não é possível prever o que acontecerá estudando agentes isolados, ou mesmo pequenos grupos de agentes, isoladamente. Não se pode presumir que os agentes de IA apoiados por LLMs agirão sempre de forma racional, diz Fox. E a complexidade vem de ter um grande número de interações ao mesmo tempo.
Alguns pesquisadores, incluindo uma equipe do Google DeepMind, argumentaram que a inteligência artificial geral (se é que é possível) poderia vir não de um único modelo superinteligente, mas de uma espécie de mente coletiva de agente, onde as capacidades do todo somam mais do que a soma de suas partes.
Falta de confiança
O Google DeepMind não é a única empresa importante de IA que alerta sobre os riscos da tecnologia que está construindo. Há algumas semanas, a Anthropic publicou diretrizes para a implantação de agentes de IA com base em uma abordagem de segurança cibernética conhecida como confiança zero, que começa com a suposição de que um sistema de computador é vulnerável, um agente é um invasor e uma violação ocorrerá.
Refael Angel, cofundador e CTO da Akeyless, uma empresa de segurança cibernética com sede em Tel Aviv, concorda que é crucial compreender os novos riscos introduzidos pelos sistemas baseados em agentes.
Todas as abordagens à segurança no passado presumiam que a máquina em questão era um software escrito por um ser humano, fazendo coisas fixas em caminhos fixos, diz Angel: “Um agente quebra todas essas suposições. Raciocina, improvisa e pode ser sequestrado por uma única frase enterrada num documento que lhe foi pedido que lesse”.
Angel dá as boas-vindas a este novo financiamento. “Nenhum laboratório deve ser o autor dos padrões de segurança em que todos os outros devem confiar”, diz ele. Mas ele adverte que os pesquisadores de segurança podem ignorar problemas enfadonhos que já existem em favor de problemas hipotéticos mais exóticos.
E, no entanto, observa Fox, os riscos que eram hipotéticos há alguns anos são agora muito reais: “O futuro chegou mais rapidamente do que talvez se esperasse”.


