Decrypt logoImage created by Decrypt using AI.

Em resumo

  • Os modelos de IA Grok, DeepSeek e Claude estão em grande destaque em um confronto de negociação de criptografia com dinheiro real ao vivo.
  • O Gemini 2.5 Pro do Google é o maior perdedor do grupo, ressaltando os riscos de confiabilidade e transparência.
  • Os resultados aprofundam a divisão entre abordagens de finanças especializadas em dados e de IA de uso geral.

Nas primeiras entradas, Grok, DeepSeek, de Elon Musk, e Claude Sonnet 4.5, da Anthropic, estão emergindo como os de melhor desempenho em um confronto de negociação de criptografia de IA com dinheiro real, cada um gerando retornos de mais de 25% até agora, enquanto modelos rivais sofreram pesadas perdas.

A “Alpha Arena”, uma competição que coloca grandes modelos de linguagem proeminentes uns contra os outros no mercado de criptomoedas ao vivo, viu o GPT-5 da OpenAI e o Gemini 2.5 Pro do Google com perdas surpreendentes de mais de 28% durante o mesmo período.

Cada modelo de IA recebeu um capital inicial de US$ 10.000 para negociar contratos perpétuos de criptomoeda na exchange Hyperliquid, apostando em ativos como Bitcoin, Dogecoin e Solana.

O objetivo declarado para os modelos é maximizar seus retornos ajustados ao risco. As regras enfatizam a autonomia, exigindo que cada IA ​​gere de forma independente as suas ideias de negociação, dimensione e cronometre as suas negociações e gira o seu próprio risco, com todos os resultados do modelo e negociações correspondentes tornados públicos para fins de transparência.

A primeira temporada do concurso começou em 17 de outubro e vai até 3 de novembro. Aqui está a tabela de classificação em tempo real.

Observe que as classificações estão em constante mudança e, possivelmente, são preliminares demais para terem muita importância. Jay Azhang, que fundou a Nof1, uma empresa de pesquisa de IA que hospeda o concurso, disse Descriptografar que com base em testes anteriores, ele não ficou surpreso com a classificação atual: “geralmente termina entre Grok e DeepSeek”, disse ele, mas “ocasionalmente Gemini e GPT”.

Notavelmente, o GPT-5 caiu cerca de 29% no mesmo período. De acordo com o Nof1, o modelo adotou uma estratégia distintamente cautelosa e avessa ao risco. Ao contrário das apostas agressivas de alta dos vencedores ou das negociações erráticas dos maiores perdedores, o GPT-5 permaneceu em grande parte inativo, realizando apenas algumas pequenas negociações.

Esta abordagem conservadora tirou-o efectivamente da corrida a ganhos importantes, mas também o protegeu das recessões significativas sofridas por alguns dos seus rivais, posicionando-o como um participante mais estável, embora não lucrativo. Entretanto, Claude Sonnet ficou confortavelmente em terceiro lugar entre os seis candidatos.

Os resultados poderão estar a enviar um sinal complexo a Wall Street, uma vez que os dois pioneiros representam dois futuros potenciais muito diferentes para a inteligência artificial nas finanças. A DeepSeek é alegadamente apoiada por um fundo de cobertura quantitativo chinês, sugerindo que o seu sucesso pode resultar de dados financeiros especializados e do ajuste fino de especialistas – um passo evolutivo para as empresas actuais orientadas por dados.

Por outro lado, o forte desempenho da Grok implica que uma IA poderosa e de uso geral pode ser capaz de navegar com sucesso nos mercados por si só – um desenvolvimento potencialmente perturbador para toda a indústria.

Ainda não estou pronto para o horário nobre

Os defensores do comércio de IA argumentam que a capacidade dos LLMs de processar e analisar rapidamente conjuntos de dados vastos e não estruturados, como notícias e mídias sociais, representa a próxima fronteira no comércio. Eles veem um futuro onde a IA pode desbloquear novas formas de alfa e democratizar análises de mercado sofisticadas.

No entanto, as perdas catastróficas de modelos como o Gemini destacam os riscos significativos que tornam as instituições financeiras cautelosas. A principal preocupação é a natureza de “caixa preta” destes sistemas, onde o raciocínio por trás de uma negociação é muitas vezes opaco e inexplicável. Esta falta de transparência é um grande obstáculo para a conformidade regulamentar e a gestão de riscos, uma vez que estabelecer confiança nas decisões de um modelo é um esforço crítico e contínuo.

Além da opacidade, existem preocupações fundamentais sobre a confiabilidade. Sabe-se que estes modelos são propensos a alucinações – fabricando informações convincentes mas falsas – o que pode ser catastrófico num ambiente de negociação real.

Além disso, um artigo de 2024 que explora as implicações dos LLM nos mercados financeiros alerta para um novo risco sistémico: se múltiplos agentes de IA aparentemente independentes forem construídos com base nos mesmos modelos subjacentes, poderão reagir aos eventos do mercado de uma forma correlacionada, potencialmente “amplificando as instabilidades do mercado” e criando flash crashes imprevistos.

O desempenho caótico do modelo Gemini 2.5 Pro na Alpha Arena, onde supostamente se envolveu em negociações frequentes e erráticas – mudando de posições de baixa para posições de alta com grandes perdas – serve como um exemplo nítido e real desses perigos. O seu fracasso realça a imprevisibilidade que torna cautelosa a indústria financeira, fortemente regulamentada.

Por enquanto, Wall Street permanece num estado de exploração cautelosa. Embora um relatório recente da Gilbert + Tobin sugira que uma onda de adoção pode ocorrer nos próximos dois anos, ele também observa que o uso atual é principalmente para “tarefas sem risco com grande assistência humana, como resumo de textos”.

Geralmente inteligente Boletim informativo

Uma jornada semanal de IA narrada por Gen, um modelo generativo de IA.



Fontedecrypt

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *