Photo by Moritz Kindler/Unsplash

À medida que a adoção da IA ​​continuou a aumentar nos últimos meses, uma coisa ficou bastante clara: não há potência computacional suficiente para todos (algo que se tornou dolorosamente óbvio à medida que os provedores de nuvem acumularam listas de espera de meses para instâncias de GPU de ponta). E, ao contrário da breve mania das GPUs de mineração de criptografia de apenas alguns anos atrás, a crise de hoje está sendo impulsionada pela demanda real de pesquisas e implantações de IA.

Para fins de perspectiva, a Amazon Web Services cobra cerca de US$ 98 por hora por um servidor de 8 GPU carregado com os chips H100 de primeira linha da Nvidia, enquanto algumas plataformas de GPU descentralizadas oferecem hardware comparável por apenas US$ 3 por hora. Em meio a essa grande diferença de preço de 30×, a Singularity Compute, o braço de infraestrutura da pioneira em IA descentralizada SingularityNET, anunciou a implantação da fase I de seu primeiro cluster de GPU NVIDIA de nível empresarial em um data center de última geração na Suécia.

Sob uma parceria com a operadora sueca Conapto, o cluster da Singularity está usando hardware NVIDIA de última geração (incluindo as GPUs H200 e L40S de próxima geração) em uma instalação em Estocolmo alimentada inteiramente por energia renovável.

O que está em oferta exatamente?

O cluster, que foi projetado para ser de alta densidade, serve como base para cargas de trabalho empresariais tradicionais e para os projetos da Aliança de Superinteligência Artificial (ASI), um ecossistema de IA descentralizado liderado pela SingularityNET. Ele oferece modos de acesso flexíveis que refletem as necessidades dos desenvolvedores modernos de IA, onde as empresas podem alugar máquinas inteiras em bare metal, ativar máquinas virtuais alimentadas por GPU ou até mesmo acessar endpoints de API dedicados para inferência de IA.

Em termos do mundo real, o que isso significa é que uma organização pode potencialmente treinar grandes modelos de aprendizado de máquina do zero, ajustar modelos existentes em conjuntos de dados personalizados ou executar inferências pesadas para aplicações como IA generativa, tudo usando a infraestrutura da Singularity.

Na frente operacional, vale a pena mencionar que a parceria será gerenciada pelo popular provedor de nuvem e parceiro da NVIDIA Cudo Compute, com este último garantindo a entrega oportuna do cluster de confiabilidade de nível empresarial e suporte que os projetos de IA de missão crítica exigem. Sobre todo o desenvolvimento, o Dr. Ben Goertzel, fundador da SingularityNET e copresidente da ASI Alliance, opinou:

“À medida que a IA acelera em direção à AGI e além, o acesso à computação de alto desempenho e eticamente alinhada está se tornando um fator definidor para quem molda o futuro. Precisamos de uma computação poderosa que esteja configurada para interoperação com redes descentralizadas executando uma rica variedade de algoritmos de IA que executam tarefas para diversas populações. A implantação da nova GPU na Suécia é um marco significativo no caminho para uma Superinteligência Artificial verdadeiramente aberta e global.”

Um sentimento semelhante foi ecoado pelo CEO da Singularity Compute, Joe Honan, que acredita que o lançamento é mais do que apenas capacidade computacional extra, mas sim um passo em direção a um novo paradigma na infraestrutura de IA, enfatizando que as GPUs NVIDIA do cluster fornecerão o desempenho e a confiabilidade que a IA moderna exige, ao mesmo tempo em que defendem os princípios de abertura, segurança e soberania na forma como a computação é provisionada.

Neste contexto mais amplo, também vale a pena mencionar que o cluster sueco está definido para servir como espinha dorsal para ASI:Cloud, o novo serviço de inferência de modelos de IA da Singularity desenvolvido em colaboração com Cudo. Para elaborar, ASI:Cloud fornece aos desenvolvedores acesso baseado em carteira a uma API compatível com OpenAI para inferência de modelo, oferecendo um caminho fácil para escalar desde funções sem servidor até servidores GPU dedicados.

Os primeiros clientes já estão sendo integrados ao cluster sueco, com a equipe sugerindo que este é apenas o começo da entrada de hardware adicional e de novas localizações geográficas na briga. Assim, para uma comunidade que tem estado frequentemente na vanguarda da revolução em curso da IA ​​e da blockchain, esta implementação parece ser um passo tangível em direção ao objetivo de longa data de uma infraestrutura de IA descentralizada e distribuída globalmente.

A corrida pela computação de IA está em andamento e esquentando rapidamente

Desde a viragem da década, o setor tecnológico tem investido grandes investimentos em infraestruturas de IA, tendo apenas em 2025 registado mais de 1 bilião de dólares em novos projetos de centros de dados centrados na IA. Até mesmo os Estados-nação parecem estar a juntar-se à França, por exemplo, tendo revelado um plano surpresa de mais de 100 mil milhões de euros para impulsionar a infraestrutura de IA.

No entanto, nem todos podem gastar milhares de milhões para resolver a atual escassez de computação, resultando no surgimento de abordagens alternativas, como redes GPU descentralizadas ou distribuídas (que podem explorar hardware espalhado por muitos locais e operadores).

Por outras palavras, se a década de 2010 recompensou aqueles que acumularam dados, a década de 2020 aparentemente recompensará aqueles que controlam o poder computacional. Nesse futuro, esforços como o novo cluster de GPU da Singularity Compute incorporam uma determinação crescente em democratizar quem moldará o próximo capítulo da IA ​​(principalmente ampliando a origem da computação por trás dela). Tempos interessantes pela frente.

Fontesartificialintelligence

By AI News

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *