DeepSeek app as the Chinese AI giant's plan to train its new AI model, R2, on Huawei’s Ascend chips has failed and forced a retreat to Nvidia hardware while delaying launch.

O plano da Deepseek de treinar seu novo modelo de IA, R2, no ascend chips da Huawei, falhou e forçou um retiro para a Nvidia enquanto atrasava o lançamento.

Durante meses, a narrativa empurrada por Pequim tem sido um progresso tecnológico imparável e uma marcha em direção à auto-suficiência. No entanto, a realidade tem o hábito de morder. Os recentes problemas da AI Chinese Darling Deepseek é um exemplo de livro didático de onde a ambição atende à parede dura das limitações técnicas.

Após o lançamento bem -sucedido de seu modelo R1 em janeiro, a Deepseek se viu sob pressão da China para defender a causa nacional. De acordo com três pessoas falando com o Financial Times, a mensagem foi clara: use as fichas da Huawei, não a da NVIDIA.

Quando se trata de treinar seu novo modelo R2, as fontes dizem que a Deepseek encontrou “questões técnicas persistentes” com os chips de AI da Huawei. Os problemas eram tão fundamentais que o projeto parou. Uma pessoa com conhecimento da situação disse que essa foi a principal razão pela qual o lançamento planejado do modelo em maio foi descartado, colocando a empresa no pé traseiro em um mercado que não espera ninguém.

Para entender por que isso é tão importante, você precisa saber a diferença entre treinamento e inferência de IA. O treinamento é a parte difícil, como enviar um aluno para a universidade para anos de aprendizado intenso. Requer quantidades colossais de energia e estabilidade. A inferência é a parte relativamente “fácil”, como fazer uma pergunta à graduação.

Deepseek descobriu que, embora os chips de Huawei estivessem prontos para o exame final, eles ainda não estavam de acordo com o cansativo curso universitário. A empresa não teve escolha a não ser voltar aos poderosos sistemas da Nvidia para fazer o treinamento. As fontes dizem que a equipe da Deepseek ainda está tentando fazer com que o modelo R2 funcione com chips da Huawei para a fase de inferência menos exigente.

Duas pessoas confirmaram que a Huawei até enviou sua própria equipe de engenheiros aos escritórios da Deepseek para ajudá -los a colocar o modelo R2 em funcionamento em suas fichas. Mas mesmo com os especialistas da sala, eles não conseguiram uma corrida de treinamento bem -sucedida.

Converse com qualquer pessoa no setor, e eles lhe dirão que isso não é uma grande surpresa. O CEO da Huawei, Ren Zhengfei, até disse no início deste ano que os EUA “exagerou as conquistas da Huawei” e a empresa “ainda não é tão boa”, observando que seus melhores chips ainda estão por trás.

No entanto, Pequim ainda está pressionando ativamente seus gigantes da tecnologia, gostam de favorecer hardware local, com o Financial Times relatando que as empresas agora precisam justificar as ordens do chip H20 compatível com a exportação da NVIDIA. Faz parte de uma estratégia construir um campeão doméstico, mas pode forçar as empresas a fazer escolhas tecnicamente inferior.

Além das questões enfrentadas com o uso de chips da Huawei para o treinamento, o fundador da Deepseek, Liang Wenfeng, teria dito à sua equipe que está insatisfeito com o progresso geral em direção ao modelo R2. Diz -se que ele está pressionando -os a mirar mais e construir algo que pode manter a empresa entre os líderes da indústria de IA.

Para todas as diretivas de cima para baixo e o orgulho nacional, as leis da engenharia ainda se aplicam. A história de Deepseek é um lembrete de que, na corrida global pela supremacia da IA, não há atalhos. A China está jogando o jogo longo, mas por enquanto, a coroa de desempenho permanece firmemente na cabeça de Nvidia.

Veja também: Ren Zhengfei: o futuro da IA da China e o longo jogo de Huawei

Deseja aprender mais sobre IA e Big Data dos líderes do setor? Confira a AI & Big Data Expo em Amsterdã, Califórnia e Londres. O evento abrangente é co-localizado com outros eventos líderes, incluindo a Conferência de Automação Inteligente, Blockx, Digital Transformation Week e Cyber Security & Cloud Expo.

Explore outros próximos eventos de tecnologia corporativa e webinars alimentados pela TechForge aqui.

Fontesartificialintelligence

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *