O sucesso da DeepSeek injetou confiança em uma indústria há muito acostumada a seguir padrões globais em vez de estabelecê-los. “Há trinta anos, nenhum chinês acreditaria que poderia estar no centro da inovação global”, afirma Alex Chenglin Wu, CEO e fundador da Atoms, uma empresa de agentes de IA e contribuidor proeminente para o ecossistema de código aberto da China. “O DeepSeek mostra que com talento técnico sólido, um ambiente de apoio e a cultura organizacional certa, é possível realizar um trabalho verdadeiramente de classe mundial.”
O momento de ruptura do DeepSeek não foi o primeiro sucesso de código aberto da China. O Qwen Lab do Alibaba vem lançando modelos abertos há anos. Em setembro de 2024, bem antes do lançamento V3 do DeepSeek, o Alibaba dizia que os downloads globais haviam ultrapassado 600 milhões. No Hugging Face, Qwen foi responsável por mais de 30% de todos os downloads de modelos em 2024. Outras instituições, incluindo a Academia de Inteligência Artificial de Pequim e a empresa de IA Baichuan, também lançaram modelos abertos já em 2023.
Mas desde o sucesso do DeepSeek, o campo se ampliou rapidamente. Empresas como Z.ai (anteriormente Zhipu), MiniMax, Tencent e um número crescente de laboratórios menores lançaram modelos que são competitivos em tarefas de raciocínio, codificação e estilo de agente. O número crescente de modelos capazes acelerou o progresso. Capacidades que antes levavam meses para chegar ao mundo do código aberto agora emergem em semanas, até mesmo dias.
“As empresas chinesas de IA obtiveram ganhos reais com o manual de código aberto”, diz Liu Zhiyuan, professor de ciência da computação na Universidade de Tsinghua e cientista-chefe da startup de IA ModelBest. “Ao divulgar pesquisas sólidas, eles constroem reputação e ganham publicidade gratuita.”
Além dos incentivos comerciais, diz Liu, o código aberto assumiu um peso cultural e estratégico. “Na comunidade de programadores chineses, o código aberto tornou-se politicamente correto”, diz ele, enquadrando-o como uma resposta ao domínio dos EUA em sistemas proprietários de IA.
Essa mudança também se reflecte a nível institucional. Universidades, incluindo a Tsinghua, começaram a encorajar o desenvolvimento da IA e as contribuições de código aberto, enquanto os decisores políticos avançaram para formalizar esses incentivos. Em Agosto, o Conselho de Estado da China divulgou um projecto de política encorajando as universidades a recompensar o trabalho de código aberto, propondo que as contribuições dos estudantes em plataformas como GitHub ou Gitee pudessem eventualmente ser contabilizadas para crédito académico.
Com um impulso crescente e um ciclo de feedback reforçado, o impulso da China para modelos de código aberto deverá continuar no curto prazo, embora a sua sustentabilidade a longo prazo ainda dependa de resultados financeiros, afirma Tiezhen Wang, que ajuda a liderar o trabalho sobre IA global na Hugging Face. Em janeiro, os laboratórios modelo Z.ai e MiniMax abriram o capital em Hong Kong. “No momento, o foco está em tornar o bolo maior”, diz Wang. “O próximo desafio é descobrir como cada empresa garante sua participação.”
A próxima onda de modelos será mais restrita – e melhor
Os modelos chineses de código aberto são líderes não apenas em volume de downloads, mas também em variedade. O Qwen do Alibaba se tornou uma das famílias de modelos abertos mais diversificadas em circulação, oferecendo uma ampla gama de variantes otimizadas para diferentes usos. A linha varia de modelos leves que podem ser executados em um único laptop até sistemas grandes, com centenas de bilhões de parâmetros, projetados para implantação em data centers. Qwen apresenta muitas variantes otimizadas para tarefas criadas pela comunidade: os modelos “instruir” são bons em seguir ordens e as variantes de “código” são especializadas em codificação.




