A governação em torno da IA física está a tornar-se mais difícil à medida que os sistemas autónomos de IA se transformam em robôs, sensores e equipamentos industriais. A questão não é apenas se os agentes de IA podem completar tarefas. É assim que suas ações são testadas, monitoradas e interrompidas quando interagem com sistemas do mundo real.
A robótica industrial já fornece uma grande base para essa discussão. A Federação Internacional de Robótica disse que 542 mil robôs industriais foram instalados em todo o mundo em 2024, mais que o dobro do nível anual registrado uma década antes. Espera que as instalações atinjam 575.000 unidades em 2025 e ultrapassem 700.000 unidades até 2028.
Os pesquisadores de mercado também estão aplicando o rótulo de IA física a um grupo mais amplo de sistemas, incluindo robótica, computação de ponta e máquinas autônomas. A Grand View Research estimou o mercado global de IA física em US$ 81,64 bilhões em 2025 e projetou que atingiria US$ 960,38 bilhões até 2033, embora a categoria dependa de como os fornecedores definem inteligência em sistemas físicos.
Da saída do modelo à ação física
O desafio da governação é diferente da automação baseada apenas em software porque os sistemas físicos podem operar em torno de locais de trabalho, infraestruturas e utilizadores humanos. Eles também podem ser conectados a equipamentos que exijam limites de segurança claros. A saída do modelo pode se tornar um movimento de robô ou uma instrução de máquina. Também pode se tornar uma decisão baseada nos dados do sensor. Isso torna os limites de segurança e os caminhos de escalada parte do projeto do sistema.
O trabalho de robótica do Google DeepMind é um exemplo recente de como os modelos de IA estão sendo adaptados para este ambiente. A empresa lançou o Gemini Robotics e o Gemini Robotics-ER em março de 2025, descrevendo-os como modelos construídos no Gemini 2.0 para robótica e IA incorporada. Gemini Robotics é um modelo de visão-linguagem-ação projetado para controlar robôs diretamente, enquanto Gemini Robotics-ER se concentra no raciocínio incorporado, incluindo compreensão espacial e planejamento de tarefas.
Um robô que utiliza este tipo de modelo pode precisar identificar um objeto, compreender uma instrução e planejar uma sequência de movimentos. Também precisa avaliar se a tarefa foi concluída corretamente. Isso cria um problema de controle que inclui tanto o comportamento do modelo quanto os limites mecânicos do sistema.
O Google DeepMind disse que robôs úteis precisam de generalidade, interatividade e destreza. A generalidade abrange objetos e ambientes desconhecidos. A interatividade está relacionada à contribuição humana e às mudanças nas condições. Destreza refere-se a tarefas físicas que exigem movimentos precisos.
Em seus materiais de lançamento, o Google DeepMind disse que a Gemini Robotics poderia seguir instruções em linguagem natural e realizar tarefas de manipulação em várias etapas. Os exemplos incluem dobrar papel, colocar itens em uma sacola e manusear objetos não vistos durante o treinamento.
Os requisitos técnicos para IA física são mais amplos do que a compreensão da linguagem. Os sistemas precisam de percepção visual e raciocínio espacial. Eles também precisam de planejamento de tarefas e detecção de sucesso. Na robótica, a detecção de sucesso é importante porque o sistema deve decidir se uma tarefa foi concluída, se deve tentar novamente ou se deve parar.
O Gemini Robotics-ER 1.6 do Google DeepMind, lançado em abril de 2026, mostra como essas funções estão sendo empacotadas em modelos mais recentes. A empresa descreve o modelo como suporte à lógica espacial, planejamento de tarefas e detecção de sucesso, com a capacidade de raciocinar através de etapas intermediárias e decidir se deve seguir em frente ou tentar novamente.
A documentação do desenvolvedor do Google diz que o Gemini Robotics-ER 1.6 está disponível em versão prévia por meio da API Gemini. A documentação o descreve como um modelo de linguagem de visão que traz as capacidades de agência do Gemini para a robótica. Esses recursos incluem interpretação visual, raciocínio espacial e planejamento a partir de comandos de linguagem natural.
O Google AI Studio fornece um ambiente de desenvolvedor para trabalhar com modelos Gemini, enquanto a API Gemini fornece uma rota para integrar esses modelos em aplicativos. No contexto da IA incorporada, isso coloca os testes e as solicitações mais perto dos desenvolvedores que criam aplicativos de agente.
Os controles de segurança passam para o design do sistema
A governança torna-se mais complexa quando estes sistemas podem chamar ferramentas, gerar código ou desencadear ações. Os controles precisam definir quais dados o sistema pode acessar, quais ferramentas ele pode usar, quais ações exigem aprovação humana e como a atividade é registrada para revisão.
A pesquisa de confiança em IA de 2026 da McKinsey aponta para o mesmo problema na IA empresarial de forma mais ampla. Concluiu que apenas cerca de um terço das organizações reportou níveis de maturidade de três ou superiores em estratégia, governação e governação de IA de agência, mesmo quando os sistemas de IA assumem funções mais autónomas.
Na robótica, a segurança também inclui o comportamento físico da máquina. O Google DeepMind descreveu a segurança dos robôs como um problema em camadas, abrangendo controles de nível inferior, como prevenção de colisões, limites de força e estabilidade, bem como raciocínio de nível superior sobre se uma ação solicitada é segura no contexto.
A empresa também introduziu o ASIMOV, um conjunto de dados para avaliar a segurança semântica em robótica e IA incorporada. O Google DeepMind disse que o conjunto de dados foi projetado para testar se os sistemas podem compreender as instruções relacionadas à segurança e evitar comportamentos inseguros em ambientes físicos.
Os mesmos controles usados para agentes de software tornam-se mais difíceis de gerenciar quando os sistemas estão conectados a robôs, sensores ou equipamentos industriais. Estes incluem direitos de acesso, trilhas de auditoria e comportamento de recusa. Eles também incluem caminhos de escalonamento e testes.
Estruturas de governança como a Estrutura de Gestão de Riscos de IA do NIST e a ISO/IEC 42001 fornecem estruturas para gerenciar riscos e responsabilidades de IA em todo o ciclo de vida do sistema. Na IA física, esses controles precisam levar em conta o comportamento do modelo, as máquinas conectadas e o ambiente operacional.
O Google DeepMind também trabalhou com empresas de robótica como parte de seu desenvolvimento de IA incorporada. Em março de 2025, a empresa disse que estava fazendo parceria com a Apptronik em robôs humanóides usando Gemini 2.0 e listou Agile Robots, Agility Robotics, Boston Dynamics e Enchanted Tools entre os testadores confiáveis do Gemini Robotics-ER.
A atualização de 2026 também fez referência ao trabalho com a Boston Dynamics envolvendo tarefas robóticas, como leitura de instrumentos. Esse tipo de caso de uso depende da compreensão visual, do planejamento de tarefas e da avaliação confiável das condições físicas.
A IA física se aplica à inspeção industrial, fabricação e logística. Também se aplica a instalações e armazéns. Estas configurações exigem que os sistemas interpretem as condições do mundo real e atuem dentro de limites definidos. A questão da governação é como esses limites são estabelecidos antes de os sistemas autónomos serem autorizados a tomar ou executar decisões.
Google DeepMind e Google AI Studio estão listados como parceiros de tecnologia hackathon para AI & Big Data Expo North America 2026, que acontecerá de 18 a 19 de maio no San Jose McEnery Convention Center.
(Foto de Mitchell Luo)
Veja também: A governança dos agentes de IA ganha foco à medida que os reguladores sinalizam lacunas de controle
Quer saber mais sobre IA e big data dos líderes do setor? Confira a AI & Big Data Expo que acontece em Amsterdã, Califórnia e Londres. O evento abrangente faz parte da TechEx e é realizado junto com outros eventos líderes de tecnologia. Clique aqui para obter mais informações.
AI News é desenvolvido pela TechForge Media. Explore outros eventos e webinars de tecnologia empresarial futuros aqui.
Fontesartificialintelligence


