Em resumo
- OpenAI revelou GPT-Rosalind para acelerar fluxos de trabalho de descoberta de medicamentos.
- Os índices de referência mostram fortes ganhos, mas o impacto no mundo real permanece limitado.
- O acesso é fortemente restrito em meio a preocupações crescentes de biossegurança.
A OpenAI acaba de nomear seu primeiro modelo de IA de domínio específico em homenagem a Rosalind Franklin – a química britânica cujo trabalho de cristalografia de raios X ajudou a revelar a dupla hélice do DNA, e a quem foi notoriamente negado o crédito por isso durante sua vida.
O GPT-Rosalind, lançado quinta-feira, é um modelo de raciocínio desenvolvido especificamente para biologia, descoberta de medicamentos e medicina translacional. É o primeiro do que a OpenAI chama de série de modelos de Ciências da Vida – uma jogada direta para um mercado onde muitos laboratórios especializados, de universidades ao Google DeepMind, estão todos disputando uma posição.
Levar um medicamento desde a descoberta do alvo até à aprovação regulamentar nos EUA leva em média 10 a 15 anos, de acordo com especialistas. É isso que a GPT-Rosaling está tentando resolver.
A OpenAI argumenta que o modelo pode compactar o trabalho em estágio inicial. Como disse a empresa, o GPT-Rosalind foi projetado para ajudar os cientistas a “explorar mais possibilidades, conexões superficiais que de outra forma poderiam ser perdidas e chegar a hipóteses melhores mais cedo”.
Os benchmarks apoiam pelo menos parte dessa ambição. No BixBench – um benchmark construído em torno de tarefas de bioinformática do mundo real – o GPT-Rosalind registrou uma taxa de aprovação de 0,751, a pontuação máxima entre os modelos com resultados publicados. No LABBench2, superou seu antecessor GPT-5.4 em seis das onze tarefas.
GPT-Rosalind supera o GPT 5.4 em todos os casos envolvendo ciências biológicas, mas é um modelo altamente específico que terá desempenho inferior em qualquer coisa diferente disso.
A OpenAI também anunciou que a Dyno Therapeutics ajudará a testar e avaliar seu modelo com base em sequências de RNA não publicadas para descartar a memorização. Os melhores de dez envios da GPT-Rosalind foram classificados acima do 95º percentil de especialistas humanos em tarefas de previsão de sequência e em torno do 84º percentil em geração.
Dito isso, Joy Jiao, líder de pesquisa em ciências biológicas da OpenAI, foi avaliado sobre o que o modelo pode realmente fazer. Ela explicou que a empresa não vê Rosalind como um modelo capaz de criar novos tratamentos de forma autônoma, mas disse aos repórteres que poderia ser uma grande ajuda para acelerar a pesquisa. “Acreditamos que há uma oportunidade real de ajudar os pesquisadores a avançar mais rapidamente em algumas das partes mais complexas e demoradas do processo científico”, disse Jiao em uma coletiva de imprensa, de acordo com o LA Times.
O ecossistema em torno do modelo pode ser tão importante quanto o próprio modelo. A OpenAI também está lançando um plugin gratuito de pesquisa em Ciências da Vida para o Codex, conectando-se a mais de 50 bancos de dados e ferramentas científicas – pesquisas de estrutura de proteínas, pesquisa de sequência, revisão de literatura, pipelines genômicos. Os usuários corporativos com acesso GPT-Rosalind obtêm a camada de raciocínio no topo. Todos os outros recebem o plugin com modelos padrão.
A OpenAI alinhou uma lista de clientes farmacêuticos e de biotecnologia para o lançamento, incluindo Amgen, Moderna e Thermo Fisher Scientific. Separadamente, está realizando uma colaboração de pesquisa com o Laboratório Nacional de Los Alamos sobre design de proteínas e catalisadores guiados por IA.
“O campo das ciências biológicas exige precisão em cada etapa. As questões são altamente complexas, os dados são altamente únicos e os riscos são incrivelmente altos”, disse Sean Bruich, vice-presidente sênior de IA e dados da Amgen, no anúncio oficial.
O acesso a Rosalind é deliberadamente restrito. O modelo é exclusivo para empresas dos EUA, sujeito a uma avaliação de qualificação e segurança. A preocupação não é abstrata: uma coligação internacional de mais de 100 cientistas já apelou a controlos mais rigorosos sobre os dados biológicos utilizados para treinar a IA, citando riscos de conceção de agentes patogénicos. A implementação restrita do OpenAI é uma resposta direta. Durante a visualização da pesquisa, o uso não consumirá os créditos da API existentes.
Este também não é o primeiro movimento da OpenAI em fluxos de trabalho científicos. O espaço de trabalho de redação científica Prism, lançado em janeiro, foi um primeiro passo. GPT-Rosalind é a continuação mais precisa e especializada – e um sinal de que os modelos específicos de domínio estão se tornando uma frente competitiva séria.
Nenhum medicamento totalmente descoberto pela IA passou nos testes de fase 3. Esse número ainda é zero. Mas se o GPT-Rosalind ajudar um pesquisador a projetar um experimento melhor seis meses mais rápido em milhares de laboratórios, então o efeito combinado sobre o que é descoberto, e quando, pode ser o jogo completo. Essa é a verdadeira tese aqui e vale a pena observar de perto.
Resumo Diário Boletim informativo
Comece cada dia com as principais notícias do momento, além de recursos originais, podcast, vídeos e muito mais.
Fontedecrypt




