Melhorar a confiança na IA de agência para fluxos de trabalho financeiros continua sendo uma grande prioridade para os líderes de tecnologia atualmente.

Nos últimos dois anos, as empresas apressaram-se a colocar agentes automatizados em fluxos de trabalho reais, abrangendo suporte ao cliente e operações de back-office. Essas ferramentas são excelentes na recuperação de informações, mas muitas vezes têm dificuldade para fornecer um raciocínio consistente e explicável durante cenários de várias etapas.

Resolvendo o problema de opacidade da automação

As instituições financeiras dependem especialmente de enormes volumes de dados não estruturados para informar memorandos de investimento, conduzir investigações de causas profundas e executar verificações de conformidade. Quando os agentes realizam essas tarefas, qualquer falha no rastreamento da lógica exata pode levar a multas regulatórias severas ou a uma alocação inadequada de ativos. Os executivos de tecnologia muitas vezes descobrem que adicionar mais agentes cria mais complexidade do que valor sem uma melhor orquestração.

O laboratório de IA de código aberto Sentient lançou hoje o Arena, que foi projetado como um ambiente de teste de estresse ao vivo e de nível de produção que permite aos desenvolvedores avaliar abordagens computacionais concorrentes contra problemas cognitivos exigentes.

O sistema da Sentient replica a realidade dos fluxos de trabalho corporativos, alimentando deliberadamente os agentes com informações incompletas, instruções ambíguas e fontes conflitantes. Em vez de pontuar se uma ferramenta gerou uma saída correta, a plataforma registra o rastreamento completo do raciocínio para ajudar as equipes de engenharia a depurar falhas ao longo do tempo.

Construindo sistemas de IA agentes confiáveis ​​para finanças

A avaliação destas capacidades antes da implantação da produção atraiu grande interesse institucional. A Sentient fez parceria com um grupo que inclui o Founders Fund, Pantera e a gigante de gestão de ativos Franklin Templeton, que supervisiona mais de US$ 1,5 trilhão. Outros participantes da fase inicial incluem alphaXiv, Fireworks, Openhands e OpenRouter.

Julian Love, Diretor Geral da Franklin Templeton Digital Assets, disse: “À medida que as empresas procuram aplicar agentes de IA em pesquisas, operações e fluxos de trabalho voltados para o cliente, a questão não é mais se esses sistemas são poderosos ou se podem gerar uma resposta, mas se são confiáveis ​​em fluxos de trabalho reais.

“Um ambiente sandbox como o Arena – onde os agentes são testados em fluxos de trabalho reais e complexos, e seu raciocínio pode ser inspecionado – ajudará o ecossistema a separar ideias promissoras de capacidades prontas para produção e aumentará a confiança em como essa tecnologia é integrada e dimensionada.”

Himanshu Tyagi, cofundador da Sentient, acrescentou: “Os agentes de IA não são mais um experimento dentro da empresa; eles estão sendo colocados em fluxos de trabalho que afetam clientes, dinheiro e resultados operacionais.

“Essa mudança muda o que importa. Não basta que um sistema seja impressionante em uma demonstração. As empresas precisam saber se os agentes conseguem raciocinar de forma confiável na produção, onde as falhas são caras e a confiança é frágil.”

As organizações em setores sensíveis como o financeiro exigem repetibilidade, comparabilidade e um método para rastrear melhorias de confiabilidade, independentemente dos modelos subjacentes que usam para IA de agência. A incorporação de plataformas como o Arena permite que os diretores de engenharia construam pipelines de dados resilientes enquanto adaptam os recursos do agente de código aberto aos seus dados internos privados.

Superando gargalos de integração

Os dados do inquérito destacam uma lacuna entre a ambição e a realidade. Embora 85 por cento das empresas pretendam operar como empresas agentes – e quase três quartos planeiem implementar agentes autónomos – menos de um quarto possui quadros de governação maduros.

Avançar de uma fase piloto para a escala total revela-se difícil para muitos. Isto acontece porque os ambientes corporativos atuais executam em média doze agentes separados, frequentemente em silos.

Os modelos de desenvolvimento de código aberto oferecem um caminho a seguir, fornecendo infraestrutura que permite experimentação mais rápida. A própria Sentient atua como arquiteta por trás de estruturas como ROMA e o modelo de código aberto Dobby para auxiliar nesses esforços de coordenação.

O foco na transparência computacional garante que quando um processo automatizado faz uma recomendação sobre um portfólio, os auditores humanos possam acompanhar exatamente como essa conclusão foi alcançada.

Ao priorizar ambientes que registram rastreamentos lógicos completos, em vez de respostas corretas isoladas, os líderes de tecnologia que integram IA de agente para operações como finanças podem garantir um melhor ROI e manter a conformidade regulatória em seus negócios.

Veja também: Goldman Sachs e Deutsche Bank testam IA agente para vigilância comercial

Quer saber mais sobre IA e big data dos líderes do setor? Confira a AI & Big Data Expo que acontece em Amsterdã, Califórnia e Londres. O evento abrangente faz parte da TechEx e está localizado junto com outros eventos de tecnologia líderes, incluindo o Cyber ​​Security & Cloud Expo. Clique aqui para mais informações.

AI News é desenvolvido pela TechForge Media. Explore outros eventos e webinars de tecnologia empresarial futuros aqui.

Fontesartificialintelligence

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *