Decrypt logoSource: Decrypt/Shutterstock

Em resumo

  • O Google atualizou Gemini com 2,5 flash imagem, mirando o domínio do OpenAI.
  • Os desenvolvedores podem remixar aplicativos de modelo no estúdio de IA e implantar projetos de imagem personalizados instantaneamente.
  • O Google expandiu o acesso através do OpenRouter e Fal.ai, ampliando a distribuição aos codificadores em todo o mundo.

O Google lançou a imagem flash Gemini 2.5 na terça -feira, entregando um novo modelo de IA que gera e edita imagens com mais precisão e consistência do personagem do que as ferramentas anteriores – atingindo para fechar a lacuna com o ChatGPT do OpenAI.

O esforço da gigante da tecnologia para integrar a edição avançada de imagens em Gemini reflete um impulso mais amplo entre as plataformas de IA para incluir a geração de imagens como um recurso obrigatório. A nova ferramenta, agora disponível em aplicativos e plataformas Gemini, permite que os usuários editem visuais usando linguagem natural-manipulando tarefas complexas, como alterações de pose ou fusão de várias imagens sem distorcer rostos ou cenas.

Em uma postagem no blog, o Google disse que o modelo permite que os usuários “coloquem o mesmo personagem em ambientes diferentes, (e) mostrem um único produto de vários ângulos … ao mesmo tempo, preservando o assunto”.

O modelo apareceu pela primeira vez sob o pseudônimo “Nano-Banana” no site de testes de crowdsourced Lmarena, onde chamou a atenção para sua edição perfeita. O Google confirmou terça -feira que estava por trás da ferramenta.

O Google disse que o sistema pode fundir várias imagens, manter a consistência do personagem para contar histórias ou marca e integrar o “conhecimento mundial” para interpretar diagramas ou combinar materiais de referência – tudo em um único prompt.

O modelo custa US $ 30 por milhão de tokens de saída – cerca de quatro centavos por imagem – no Google Cloud. Também está sendo distribuído via OpenRouter e Fal.ai.

O OpenAI introduziu o modelo GPT-4O em maio de 2024 e adicionou geração de imagens em março de 2025, o que ajudou a aumentar o uso do ChatGPT acima de 700 milhões de usuários ativos semanais. O Google relatou 400 milhões de usuários mensais de gêmeos ativos em agosto de 2025, o que indicaria o uso semanal que segue consideravelmente o OpenAI.

O Google disse que todas as saídas incluirão uma marca d’água sintid invisível e uma tag de metadados para marcá-los como gerados pela IA para abordar preocupações sobre uso indevido e autenticidade.

Geralmente inteligente Boletim informativo

Uma jornada semanal de IA narrada por Gen, um modelo generativo de IA.



Fontedecrypt

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *