Decrypt logoSource: Decrypt/Shutterstock

O Google lançou hoje o Gemini 3 Pro em uma prévia pública, chamando-o de modelo de IA mais capaz da empresa até o momento. O sistema lida com texto, imagens, áudio e vídeo simultaneamente enquanto processa até 1 milhão de tokens de contexto – aproximadamente o equivalente a 700.000 palavras, ou cerca de 10 romances completos.

O modelo de visualização está disponível gratuitamente para qualquer pessoa experimentar aqui.

O Google disse que o modelo superou seu antecessor, Gemini 2.5 Pro, em quase todos os benchmarks testados pela empresa. No Último Exame da Humanidade, um teste de raciocínio acadêmico, o Gemini 3 Pro obteve 37,5% em comparação com 21,6% do 2,5 Pro. No ARC-AGI-2, um benchmark de quebra-cabeças de raciocínio visual, a diferença aumentou ainda mais: 31,1% contra 4,9%.

É claro que o verdadeiro desafio neste momento da corrida à IA não é tanto técnico, mas sim ganhar quota de mercado comercial.

O Google, que antes parecia indomável no espaço de busca, cedeu uma enorme quantidade de terreno para OpenAI, que afirma ter cerca de 800 milhões de usuários semanais ChatGPT versus Gemini, que supostamente tem cerca de 650 milhões. mensal Usuários. O Google não informou quantos números semanais possui, mas isso seria muito menor do que sua contagem mensal.

Ainda assim, as conquistas técnicas do Gemini 3 são impressionantes.

Gemini 3 Pro usa o que o Google chama de arquitetura esparsa de mistura de especialistas. Em vez de ativar todos os mais de 1 trilhão de parâmetros para cada consulta, o sistema roteia cada entrada para sub-redes especializadas. Apenas uma fração do modelo – o especialista naquela tarefa específica – é executada a qualquer momento, reduzindo custos computacionais e mantendo o desempenho.

Ao contrário do GPT e do Claude, que são modelos grandes e densos (um pau para toda obra), a abordagem do Google funciona como uma grande organização operaria. Uma empresa com 1.000 funcionários não convoca todos para todas as reuniões; equipes específicas lidam com problemas específicos. O Gemini 3 Pro funciona da mesma maneira, direcionando as perguntas para as redes de especialistas certas.

O Google treinou o modelo em documentos da web, repositórios de código, imagens, arquivos de áudio e vídeo, além de dados sintéticos gerados por outros sistemas de IA. A empresa filtrou os dados de treinamento quanto à qualidade e segurança, removendo conteúdo pornográfico, material violento e qualquer coisa que violasse as leis de segurança infantil. O treinamento aconteceu nas Unidades de Processamento Tensor do Google usando os softwares JAX e ML Pathways.

Um teste rápido do modelo mostrou que ele era muito capaz. Em nosso teste de codificação usual solicitando a geração de um jogo furtivo, este foi o primeiro modelo que gerou um jogo 3D em vez de uma experiência 2D. Outras execuções forneceram versões 2D, mas todas eram funcionais e rápidas.

Essa abordagem segue o estilo do ChatGPT ou Perplexity, que incentiva novas interações compartilhando perguntas e sugestões de acompanhamento, mas a implementação do Google é muito mais limpa e útil.

Ao gerar o código, a interface fornece dicas para ajudar nos prompts subsequentes, para que o usuário possa orientar o modelo para gerar um código melhor, corrigir bugs e melhorar a lógica do aplicativo, a interface do usuário, etc. Ela também oferece aos usuários a opção de implantar seu código e codificar aplicativos com tecnologia Gemini.

No geral, este modelo parece estar especialmente focado em tarefas de codificação. A criatividade não é seu ponto forte, mas pode ser fácil de orientar com um bom prompt do sistema e exemplos, pois possui uma janela de contexto de token muito grande.

Uma versão arquivada do cartão do modelo do Gemini 3 – um documento que fornece informações essenciais sobre o design do modelo, uso pretendido, desempenho e limitações – publicada pelo Google DeepMind mostra que o Gemini 3 Pro pode gerar até 64.000 tokens de saída e mantém um limite de conhecimento de janeiro de 2025. O Google reconheceu que o modelo pode ter alucinações e ocasionalmente apresentar lentidão ou tempos limite.

Um cartão modelo oficial não está disponível atualmente.

Conforme mencionado, o Google AI Studio oferece atualmente a todos acesso gratuito ao Gemini 3 Pro. A Vertex AI e a API Gemini também oferecem suporte ao modelo. No entanto, o Gemini 3 Pro ainda não está disponível no aplicativo Gemini – nem mesmo para assinantes pagantes do Gemini Pro.

O lançamento de novembro posiciona o Google contra Claude Sonnet 4.5 da Anthropic, Grok 4.1 e até mesmo GPT-5.1 da OpenAI. As pontuações de benchmark sugerem que o Gemini 3 Pro lidera em tarefas de raciocínio e multimodais, embora o desempenho no mundo real varie de acordo com o caso de uso.

O Google distribuiu o Gemini 3 Pro por meio de suas plataformas em nuvem, sujeito aos termos de serviço existentes. A política de uso proibido de IA generativa da empresa se aplica, bloqueando o uso em atividades perigosas, comprometimentos de segurança, conteúdo sexualmente explícito, violência, discurso de ódio e desinformação.

Geralmente inteligente Boletim informativo

Uma jornada semanal de IA narrada por Gen, um modelo generativo de IA.



Fontedecrypt

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *