A Deep Cogito lançou o Cogito V2, uma nova família de modelos de IA de código aberto que aprimoram suas próprias habilidades de raciocínio.
Lançado sob uma licença de código aberto, a nova linha Cogito V2 inclui quatro modelos de IA de raciocínio híbrido: dois de tamanho médio em parâmetros de 70b e 109b e duas versões em larga escala em 405b e 671b.
A maior, um modelo de 671b de mistura de especialistas (MOE), já está sendo apontado como um dos mais poderosos AIs de código aberto do mundo. A empresa relata que compete com o mais recente da Deepseek e está fechando a lacuna em sistemas proprietários como O3 e Claude 4 Opus.
Mas a história real não é apenas sobre tamanho ou poder; É sobre uma mudança fundamental na maneira como a IA aprende. Em vez de apenas ‘pensar’ por mais tempo em tempo de inferência para encontrar uma resposta, o Cogito V2 foi projetado para internalizar seus próprios processos de raciocínio.
Esse raciocínio internalizado é alcançado através de uma técnica chamada destilação e amplificação iterada (IDA), que destilam as descobertas de uma pesquisa de volta aos parâmetros principais do modelo. O objetivo é construir uma “intuição” mais forte, permitindo que o modelo antecipe o resultado de seu próprio raciocínio sem ter que realizar toda a pesquisa.
Como os modelos de IA de código aberto têm um melhor “intestino” para a abordagem certa, suas cadeias de raciocínio são 60% mais curtas do que as de rivais como Deepseek R1.
Essa eficiência se estende ao orçamento. A Deep Cogito diz que desenvolveu todos os seus modelos – desde experimentos a treinamento final – para um total combinado de menos de US $ 3,5 milhões. Ainda é uma grande quantia provável para você ou eu, mas minúsculas em comparação com os gastos de muitos dos principais laboratórios de IA.
O modelo de 671B recebeu atenção especial, treinou não apenas para melhorar suas respostas finais, mas para refinar o próprio processo de pensamento. Essa abordagem desencoraja o modelo de “meandros” e recompensa um caminho mais direto para a solução. Os dados de desempenho sugerem que funciona, com o modelo de IA de código aberto da Deep Cogito correspondendo ou excedendo as mais recentes versões Deepseek nos principais benchmarks enquanto estiver perto de alternativas proprietárias:
Talvez um dos resultados mais surpreendentes seja a capacidade dos modelos de raciocinar sobre imagens; uma habilidade pela qual nunca foram treinados explicitamente.
A equipe compartilhou um exemplo desse raciocínio em que o modelo de IA de código aberto da Deep Cogito comparou duas imagens de um pato e um leão, demonstrando um processo de pensamento profundo sobre seus habitats, cores e composição puramente através do aprendizado de transferência. O Deep Cogito acredita que essa propriedade emergente pode ser uma maneira poderosa de inicializar dados de treinamento para futuros sistemas de raciocínio multimodais.
Olhando para o futuro, a equipe Deep Cogito planeja “subir nas subidas com os ganhos do auto-aperfeiçoamento iterativo” em sua busca para construir superinteligência. Eles reafirmaram seu compromisso de que todos os modelos de IA que eles criam serão de código aberto.
Veja também: Leak sugere
Deseja aprender mais sobre IA e Big Data dos líderes do setor? Confira a AI & Big Data Expo em Amsterdã, Califórnia e Londres. O evento abrangente é co-localizado com outros eventos líderes, incluindo a Conferência de Automação Inteligente, Blockx, Digital Transformation Week e Cyber Security & Cloud Expo.
Explore outros próximos eventos de tecnologia corporativa e webinars alimentados pela TechForge aqui.
Fontesartificialintelligence