Um vazamento sugere que o OpenAI está prestes a lançar um poderoso novo modelo de IA de código aberto, potencialmente em poucas horas.

As evidências vêm de uma trilha de farinha de pão digital, ansiosa pelos desenvolvedores. No centro de tudo, há capturas de tela mostrando uma série de repositórios modelo com nomes como Yofo-DeepCurrent/GPT-OSS-120B e Yofo-Wildflower/GPT-20B. Os repositórios foram excluídos, mas as contas apresentam membros da equipe OpenAI.

Essa tag GPT é a verdadeira arma de fumantes, aparentemente uma sinalização clara para o ‘software de código aberto GPT’. Para uma empresa que cada vez mais guardou seus modelos de primeira linha, isso seria um pouco de retorno às suas raízes. O fato de estarmos vendo várias versões, com diferentes nomes e tamanhos, sugere que uma família de modelos bem planejada está prestes a fazer sua estréia.

Graças a um arquivo de configuração vazado, podemos até espiar sob o capô da suspeita versão de 120 bilhões de parâmetros.

O modelo parece ter sido construído em uma mistura de especialistas, ou MOE, arquitetura. Pense nisso menos como um cérebro único e monolítico tentando saber tudo e mais como um conselho de 128 consultores especializados. Quando uma consulta entra, o sistema seleciona de forma inteligente os quatro melhores especialistas para o trabalho. Isso fornece ao modelo o vasto conhecimento de sua enorme contagem de parâmetros, mas a velocidade e a agilidade de um sistema muito menor, pois apenas uma fração está funcionando a qualquer momento.

Esse design coloca o modelo de IA de código aberto do Openai diretamente em competição com os queridos da cena, como o mixtral de Mistral AI e a família Llama de Meta.

E as especificações não param por aí. O modelo de IA de código aberto da OpenAI parece ter um enorme vocabulário, o que deve torná-lo mais eficiente com uma ampla gama de idiomas e usa a atenção da janela deslizante para lidar com longos fluxos de texto sem suar. Na prática, tudo isso aponta para um modelo que é poderoso e prático de ser executado.

Então, por que o Openai faria esse movimento agora? Durante anos, a empresa enfrentou jabs gentis e críticas definitivas por se afastarem de seus começos mais abertos. O lançamento de um poderoso GPTs seria uma ofensiva enorme de charme direcionada diretamente aos desenvolvedores e pesquisadores que se sentiram deixados para trás.

Claro, também é uma jogada competitiva astuta. Meta e Mistral mostraram como um próspero ecossistema de código aberto pode impulsionar a inovação. Ao soltar um poderoso modelo de IA de código aberto como esse parece estar na mistura, o Openai não está apenas se juntando à corrida; Está tentando redefinir a pista.

Até recebermos a palavra oficial do Openai, tudo isso é, tecnicamente, rumores. Mas é um boato com substância, apoiado por arquivos de código e configuração.

O lançamento de um modelo MOE de alto desempenho e 120 bilhões de parâmetros de código aberto do nome mais famoso da IA seria nada menos que um evento de referência, e parece ser iminente.

(Foto de Mariia Shalabaieva)

Veja também: Zuckerberg descreve a visão da AI da Meta para a ‘superinteligência pessoal’

Deseja aprender mais sobre IA e Big Data dos líderes do setor? Confira a AI & Big Data Expo em Amsterdã, Califórnia e Londres. O evento abrangente é co-localizado com outros eventos líderes, incluindo a Conferência de Automação Inteligente, Blockx, Digital Transformation Week e Cyber Security & Cloud Expo.

Explore outros próximos eventos de tecnologia corporativa e webinars alimentados pela TechForge aqui.

Fontesartificialintelligence

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *