Source: Kimi's X account

Uma startup chinesa de IA, Moonshot, interrompeu as expectativas no desenvolvimento de inteligência artificial depois que seu modelo Kimi K2 Thinking ultrapassou o GPT-5 da OpenAI e o Claude Sonnet 4.5 da Anthropic em vários benchmarks de desempenho, provocando um debate renovado sobre se o domínio da IA ​​dos EUA está sendo desafiado pela inovação chinesa econômica.

A Moonshot AI, com sede em Pequim, avaliada em US$ 3,3 bilhões e apoiada pelos gigantes da tecnologia Alibaba Group Holding e Tencent Holdings, lançou o modelo de código aberto Kimi K2 Thinking em 6 de novembro, alcançando o que os observadores da indústria estão chamando de outro “momento DeepSeek” – uma referência à interrupção anterior das suposições de custos de IA da startup com sede em Hangzhou.

As métricas de desempenho desafiam os modelos dos EUA

De acordo com a postagem no blog GitHub da empresa, Kimi K2 Thinking obteve 44,9% no Último Exame da Humanidade, um grande benchmark de modelo de linguagem que consiste em 2.500 perguntas em uma ampla gama de assuntos, excedendo os 41,7% do GPT-5.

O modelo também alcançou 60,2% no benchmark BrowseComp, que avalia a proficiência na navegação na web e a persistência na busca de informações de grandes agentes de modelos de linguagem, e obteve 56,3% para liderar no benchmark Seal-0 projetado para desafiar modelos de pesquisa aumentada em consultas de pesquisa do mundo real.

VentureBeat relataram que a reunião de lançamento totalmente aberta ou a superação das pontuações do GPT-5 marcam um ponto de inflexão em que a lacuna entre os sistemas de fronteira fechada e os modelos disponíveis publicamente entrou em colapso para raciocínio e codificação de ponta.

A eficiência de custos levanta questões

A popularidade do modelo cresceu depois que a CNBC informou que seu custo de treinamento era de apenas US$ 4,6 milhões, embora a Moonshot AI não tenha comentado o custo. Segundo cálculos do Postagem matinal do sul da Chinao custo da interface de programação de aplicativos do Kimi K2 Thinking era de seis a 10 vezes mais barato que o dos modelos OpenAI e Anthropic.

O modelo usa uma arquitetura Mixture-of-Experts com um trilhão de parâmetros totais, dos quais 32 bilhões são ativados por inferência, e foi treinado usando a quantização INT4 para alcançar uma melhoria de velocidade de geração de aproximadamente duas vezes, mantendo o desempenho de última geração.

Thomas Wolf, cofundador da Hugging Face, comentou no X que Kimi K2 Thinking foi outro caso de um modelo de código aberto passando por um modelo de código fechado, perguntando: “Este é outro momento do DeepSeek? Devemos esperar (um) a cada dois meses agora?”

Capacidades e limitações técnicas

Os pesquisadores da Moonshot AI disseram que o Kimi K2 Thinking estabeleceu “novos recordes em benchmarks que avaliam o raciocínio, a codificação e as capacidades do agente”. O modelo pode executar de 200 a 300 chamadas sequenciais de ferramentas sem interferência humana, raciocinando de forma coerente em centenas de etapas para resolver problemas complexos.

Testes independentes realizados pela consultoria Artificial Analysis colocaram o Kimi K2 no topo de seu benchmark de agência Tau-2 Bench Telecom com 93% de precisão, que foi descrita como a pontuação mais alta que ele mediu de forma independente.

No entanto, Nathan Lambert, investigador do Allen Institute for AI, sugeriu que ainda há um intervalo de tempo de aproximadamente quatro a seis meses no desempenho bruto entre os melhores modelos fechados e abertos, embora tenha reconhecido que os laboratórios chineses estão a aproximar-se e a ter um desempenho muito forte nos principais benchmarks.

Implicações de mercado e pressão competitiva

Zhang Ruiwang, arquitecto de sistemas de tecnologia de informação baseado em Pequim, disse que a tendência é que as empresas chinesas mantenham os custos baixos, explicando: “O desempenho global dos modelos chineses ainda está atrás dos principais modelos dos EUA, por isso têm de competir nos domínios da relação custo-eficácia para encontrar uma saída”.

Zhang Yi, analista-chefe da consultoria iiMedia, disse que os custos de treinamento dos modelos chineses de IA estavam sofrendo uma “queda semelhante a um penhasco”, impulsionados pela inovação na arquitetura do modelo e na técnica de treinamento, e pela entrada de dados de treinamento de qualidade, marcando uma mudança na acumulação de recursos de computação nos primeiros dias.

O modelo foi lançado sob uma licença modificada do MIT que concede direitos comerciais e derivativos totais, com uma restrição: os implantadores que atendem mais de 100 milhões de usuários ativos mensais ou geram mais de US$ 20 milhões por mês em receita devem exibir “Kimi K2” em destaque na interface do usuário do produto.

Resposta da indústria e perspectivas futuras

Deedy Das, sócio da empresa de capital de risco em estágio inicial Menlo Ventures, escreveu em um post no X que “Hoje é um ponto de viragem na IA. Um modelo chinês de código aberto é o número 1. Momento seminal na IA”.

Nathan Lambert escreveu em um artigo da Substack que o sucesso dos desenvolvedores chineses de IA de código aberto, incluindo Moonshot AI e DeepSeek, mostrou como eles “fizeram os laboratórios fechados suarem”, acrescentando “Há sérias pressões de preços e expectativas que (os desenvolvedores dos EUA) precisam gerenciar”.

O lançamento posiciona a Moonshot AI ao lado de outras empresas chinesas de IA, como DeepSeek, Qwen e Baichuan, que estão desafiando cada vez mais a narrativa da supremacia americana da IA ​​por meio de inovação econômica e estratégias de desenvolvimento de código aberto.

Resta saber se isto representa uma vantagem competitiva sustentável ou uma convergência temporária de capacidades, à medida que as empresas dos EUA e da China continuam a desenvolver os seus modelos.

a natureza pública das declarações e a reacção do mercado sugerem que discussões substantivas poderão em breve ter lugar.

O cenário dos chips de IA está entrando em um período de mudança. As organizações devem manter a flexibilidade na sua estratégia de infraestrutura e monitorizar como parcerias como a Tesla-Intel podem remodelar a dinâmica competitiva da produção de hardware de IA.

As decisões tomadas hoje sobre parcerias de fabricação de chips poderão determinar quais organizações terão acesso a infraestruturas de IA econômicas e de alto desempenho nos próximos anos.

Foto de Moonshot AI)

Veja também: Disrupção do DeepSeek: a inovação chinesa em IA reduz a divisão tecnológica global

Quer saber mais sobre IA e big data dos líderes do setor? Confira a AI & Big Data Expo que acontece em Amsterdã, Califórnia e Londres. Este evento abrangente faz parte da TechEx e é realizado junto com outros eventos de tecnologia líderes. Clique aqui para mais informações.

AI News é desenvolvido pela TechForge Media. Explore outros eventos e webinars de tecnologia empresarial futuros aqui.



Fontesartificialintelligence

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *