IA de código aberto que aprimora suas habilidades de raciocínio

A Deep Cogito lançou o Cogito V2, uma nova família de modelos de IA de código aberto que aprimoram suas próprias habilidades de raciocínio.

Lançado sob uma licença de código aberto, a nova linha Cogito V2 inclui quatro modelos de IA de raciocínio híbrido: dois de tamanho médio em parâmetros de 70b e 109b e duas versões em larga escala em 405b e 671b.

A maior, um modelo de 671b de mistura de especialistas (MOE), já está sendo apontado como um dos mais poderosos AIs de código aberto do mundo. A empresa relata que compete com o mais recente da Deepseek e está fechando a lacuna em sistemas proprietários como O3 e Claude 4 Opus.

Mas a história real não é apenas sobre tamanho ou poder; É sobre uma mudança fundamental na maneira como a IA aprende. Em vez de apenas ‘pensar’ por mais tempo em tempo de inferência para encontrar uma resposta, o Cogito V2 foi projetado para internalizar seus próprios processos de raciocínio.

Esse raciocínio internalizado é alcançado através de uma técnica chamada destilação e amplificação iterada (IDA), que destilam as descobertas de uma pesquisa de volta aos parâmetros principais do modelo. O objetivo é construir uma “intuição” mais forte, permitindo que o modelo antecipe o resultado de seu próprio raciocínio sem ter que realizar toda a pesquisa.

Como os modelos de IA de código aberto têm um melhor “intestino” para a abordagem certa, suas cadeias de raciocínio são 60% mais curtas do que as de rivais como Deepseek R1.

Essa eficiência se estende ao orçamento. A Deep Cogito diz que desenvolveu todos os seus modelos – desde experimentos a treinamento final – para um total combinado de menos de US $ 3,5 milhões. Ainda é uma grande quantia provável para você ou eu, mas minúsculas em comparação com os gastos de muitos dos principais laboratórios de IA.

O modelo de 671B recebeu atenção especial, treinou não apenas para melhorar suas respostas finais, mas para refinar o próprio processo de pensamento. Essa abordagem desencoraja o modelo de “meandros” e recompensa um caminho mais direto para a solução. Os dados de desempenho sugerem que funciona, com o modelo de IA de código aberto da Deep Cogito correspondendo ou excedendo as mais recentes versões Deepseek nos principais benchmarks enquanto estiver perto de alternativas proprietárias:

Talvez um dos resultados mais surpreendentes seja a capacidade dos modelos de raciocinar sobre imagens; uma habilidade pela qual nunca foram treinados explicitamente.

A equipe compartilhou um exemplo desse raciocínio em que o modelo de IA de código aberto da Deep Cogito comparou duas imagens de um pato e um leão, demonstrando um processo de pensamento profundo sobre seus habitats, cores e composição puramente através do aprendizado de transferência. O Deep Cogito acredita que essa propriedade emergente pode ser uma maneira poderosa de inicializar dados de treinamento para futuros sistemas de raciocínio multimodais.

Olhando para o futuro, a equipe Deep Cogito planeja “subir nas subidas com os ganhos do auto-aperfeiçoamento iterativo” em sua busca para construir superinteligência. Eles reafirmaram seu compromisso de que todos os modelos de IA que eles criam serão de código aberto.

Veja também: Leak sugere

Deseja aprender mais sobre IA e Big Data dos líderes do setor? Confira a AI & Big Data Expo em Amsterdã, Califórnia e Londres. O evento abrangente é co-localizado com outros eventos líderes, incluindo a Conferência de Automação Inteligente, Blockx, Digital Transformation Week e Cyber Security & Cloud Expo.

Explore outros próximos eventos de tecnologia corporativa e webinars alimentados pela TechForge aqui.

Fontesartificialintelligence

IA de código aberto que aprimora suas habilidades de raciocínio

ByRyan Daws

By Ryan Daws

Leia Também

Negócio de persianas Perp DEX Merkle Trade com base em Aptos

OKX Ventures apoia STBL em parceria com Hamilton Lane e Securitize

Tom Lee, da Bitmine, diz que o fundo pode estar próximo

Deixe um comentário Cancelar resposta

Leia Também:

Negócio de persianas Perp DEX Merkle Trade com base em Aptos

OKX Ventures apoia STBL em parceria com Hamilton Lane e Securitize

Tom Lee, da Bitmine, diz que o fundo pode estar próximo

Draft BIP 360 do Bitcoin apresenta P2MR em direção à resistência quântica