A Deep Cogito lançou o Cogito V2, uma nova família de modelos de IA de código aberto que aprimoram suas próprias habilidades de raciocínio.

Lançado sob uma licença de código aberto, a nova linha Cogito V2 inclui quatro modelos de IA de raciocínio híbrido: dois de tamanho médio em parâmetros de 70b e 109b e duas versões em larga escala em 405b e 671b.

A maior, um modelo de 671b de mistura de especialistas (MOE), já está sendo apontado como um dos mais poderosos AIs de código aberto do mundo. A empresa relata que compete com o mais recente da Deepseek e está fechando a lacuna em sistemas proprietários como O3 e Claude 4 Opus.

Mas a história real não é apenas sobre tamanho ou poder; É sobre uma mudança fundamental na maneira como a IA aprende. Em vez de apenas ‘pensar’ por mais tempo em tempo de inferência para encontrar uma resposta, o Cogito V2 foi projetado para internalizar seus próprios processos de raciocínio.

Esse raciocínio internalizado é alcançado através de uma técnica chamada destilação e amplificação iterada (IDA), que destilam as descobertas de uma pesquisa de volta aos parâmetros principais do modelo. O objetivo é construir uma “intuição” mais forte, permitindo que o modelo antecipe o resultado de seu próprio raciocínio sem ter que realizar toda a pesquisa.

Como os modelos de IA de código aberto têm um melhor “intestino” para a abordagem certa, suas cadeias de raciocínio são 60% mais curtas do que as de rivais como Deepseek R1.

Essa eficiência se estende ao orçamento. A Deep Cogito diz que desenvolveu todos os seus modelos – desde experimentos a treinamento final – para um total combinado de menos de US $ 3,5 milhões. Ainda é uma grande quantia provável para você ou eu, mas minúsculas em comparação com os gastos de muitos dos principais laboratórios de IA.

O modelo de 671B recebeu atenção especial, treinou não apenas para melhorar suas respostas finais, mas para refinar o próprio processo de pensamento. Essa abordagem desencoraja o modelo de “meandros” e recompensa um caminho mais direto para a solução. Os dados de desempenho sugerem que funciona, com o modelo de IA de código aberto da Deep Cogito correspondendo ou excedendo as mais recentes versões Deepseek nos principais benchmarks enquanto estiver perto de alternativas proprietárias:

Talvez um dos resultados mais surpreendentes seja a capacidade dos modelos de raciocinar sobre imagens; uma habilidade pela qual nunca foram treinados explicitamente.

A equipe compartilhou um exemplo desse raciocínio em que o modelo de IA de código aberto da Deep Cogito comparou duas imagens de um pato e um leão, demonstrando um processo de pensamento profundo sobre seus habitats, cores e composição puramente através do aprendizado de transferência. O Deep Cogito acredita que essa propriedade emergente pode ser uma maneira poderosa de inicializar dados de treinamento para futuros sistemas de raciocínio multimodais.

Olhando para o futuro, a equipe Deep Cogito planeja “subir nas subidas com os ganhos do auto-aperfeiçoamento iterativo” em sua busca para construir superinteligência. Eles reafirmaram seu compromisso de que todos os modelos de IA que eles criam serão de código aberto.

Veja também: Leak sugere

Deseja aprender mais sobre IA e Big Data dos líderes do setor? Confira a AI & Big Data Expo em Amsterdã, Califórnia e Londres. O evento abrangente é co-localizado com outros eventos líderes, incluindo a Conferência de Automação Inteligente, Blockx, Digital Transformation Week e Cyber Security & Cloud Expo.

Explore outros próximos eventos de tecnologia corporativa e webinars alimentados pela TechForge aqui.

Fontesartificialintelligence

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *