“A grande maioria de nossos clientes (corporativos e startups) já está usando muitos modelos abertos”, disse Casey Dvorak, gerente de programa de pesquisa da Openai, em um briefing da mídia sobre o lançamento do modelo. “Como não existe um modelo aberto (competitivo) do OpenAI, queríamos conectar essa lacuna e realmente permitir que eles usem nossa tecnologia em geral”.

Os novos modelos vêm em dois tamanhos diferentes, o menor dos quais pode teoricamente executar em 16 GB de RAM – a quantidade mínima que a Apple atualmente oferece em seus computadores. O modelo maior requer um laptop de ponta ou hardware especializado.

Os modelos abertos têm alguns casos importantes de uso. Algumas organizações podem querer personalizar modelos para seus próprios fins ou economizar dinheiro executando modelos em seu próprio equipamento, embora esse equipamento tenha um custo substancial. Outros – submetidos a hospitais, escritórios de advocacia e governos – podem precisar de modelos que possam ser executados localmente por razões de segurança de dados.

A OpenAI facilitou essa atividade ao liberar seus modelos abertos sob uma licença permissiva do Apache 2.0, que permite que os modelos sejam usados para fins comerciais. Nathan Lambert, liderança pós-treinamento no Instituto Allen da IA, diz que essa escolha é louvável: essas licenças são típicas para lançamentos chineses de modelos abertos, mas a Meta lançou seus modelos de lhama sob uma licença mais restritiva e sob medida. “É uma coisa muito boa para a comunidade aberta”, diz ele.

Os pesquisadores que estudam como o LLMS funcionam também precisam de modelos abertos, para que possam examinar e manipular esses modelos em detalhes. “Em parte, trata -se de reafirmar o domínio do Openai no ecossistema de pesquisa”, diz Peter Henderson, professor assistente da Universidade de Princeton que trabalhou extensivamente com modelos abertos. Se os pesquisadores adotarem o GPT-ROSS como novos cavalos de trabalho, o Openai poderá ver alguns benefícios concretos, diz Henderson-ele poderá adotar inovações descobertas por outros pesquisadores em seu próprio ecossistema modelo.

De maneira mais ampla, diz Lambert, lançar um modelo aberto agora pode ajudar a OpenAI a restabelecer seu status em um ambiente de IA cada vez mais lotado. “Isso meio que remonta anos atrás, onde eles foram vistos como o Empresa de IA ”, diz ele. Os usuários que desejam usar modelos abertos agora terão a opção de atender a todas as suas necessidades com os produtos Openai, em vez de recorrer à llama da Meta ou à Qwen da Alibaba quando precisam executar algo localmente.

A ascensão de modelos abertos chineses como Qwen no ano passado pode ter sido um fator particularmente saliente no cálculo da Openai. Um funcionário da OpenAI enfatizou no briefing da mídia que a empresa não vê esses modelos abertos como uma resposta a ações tomadas por qualquer outra empresa de IA, mas o OpenAI está claramente sintonizado com as implicações geopolíticas do domínio do modelo aberto da China. “O amplo acesso a esses modelos de pesos abertos capazes criados nos EUA ajuda a expandir a AI Rails democrata”, escreveu a empresa em uma postagem de blog anunciando o lançamento dos modelos.

technologyreview

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *