Em resumo
- O Lyria 3 do Google está sendo lançado no Gemini, gerando músicas completas de 30 segundos a partir de prompts de texto ou imagens.
- O modelo produz faixas coerentes, mas luta com gêneros de nicho e limita a duração da produção.
- Rivais como Suno e Udio ainda lideram com músicas mais longas, controles mais profundos e fluxos de trabalho mais maduros.
O Google passou anos construindo silenciosamente seu modelo musical de IA. Na terça-feira, finalmente o colocou em algum lugar que todos pudessem realmente usar.
Lyria 3, o mais recente modelo de geração de música do Google DeepMind, agora está sendo lançado em versão beta dentro do aplicativo Gemini, permitindo que qualquer usuário com mais de 18 anos descreva uma ideia ou carregue uma foto e receba uma faixa totalmente produzida em segundos – letras, instrumentais e capa gerada por IA incluída.
“Basta descrever uma ideia ou fazer upload de uma foto, como ‘uma lenta jam cômica de R&B sobre uma meia encontrando seu par’ e, em questão de segundos, Gemini irá traduzi-la em uma faixa cativante e de alta qualidade”, disse o Google em seu blog oficial. “Para ir ainda mais longe, você pode até pedir a Gêmeos que se inspire em algo que você carrega.”
Nós demos uma volta. A versão resumida: Funciona, é divertido e pode impressionar quem nunca usou outros modelos de última geração como Suno ou Udio. Para aqueles que já o fizeram, isso não substituirá seus fluxos de trabalho tão cedo.
As faixas que Lyria 3 produz têm 30 segundos de duração. Esse é o limite no momento, e o Google é sincero quanto a isso – o objetivo declarado não é fazer músicas comerciais sofisticadas, mas criar momentos compartilháveis. O resultado que testamos foi coerente, a letra correspondeu ao prompt e a qualidade da produção foi decente.
Aqui está o que Google, Suno e Udio podem fazer com o mesmo prompt:
O problema começa quando você ultrapassa os limites. Lyria 3 parece ter uma gama confortável de gêneros nos quais navega bem – pop, afrobeat, R&B, hip-hop leve. Mas quando testamos instruções pedindo estilos mais específicos ou incomuns, o modelo teve dificuldade em cumpri-las. O guia de sugestões da DeepMind reconhece isso implicitamente: é rico em exemplos para gêneros convencionais e leve em orientações para qualquer coisa fora desses caminhos.
Compare isso com o Udio, que quando foi lançado em 2024 veio com controles como um controle deslizante de “força do prompt”, um ajustador de clareza para ruído de fundo e aviso negativo para excluir sons ou estilos específicos. Ou Suno, que vem gerando músicas completas de vários minutos com estrutura musical adequada – versos, refrões, pontes – e é considerada o melhor modelo da cena. Ambas as ferramentas permitem gerar faixas longas que parecem músicas reais, não amostras. O limite de 30 segundos do Lyria 3 e a tendência de se desviar de avisos incomuns o colocam em um nível diferente.
Há também algum contexto jurídico que vale a pena mencionar. Tanto Suno quanto Udio foram processados pela Recording Industry Association of America em 2024 por supostamente treinar seus modelos em gravações protegidas por direitos autorais sem permissão. A Udio fez um acordo com a Warner Music em novembro de 2025 e agora está em transição para uma plataforma totalmente licenciada, com lançamento em 2026. O caso de Suno continua.
O Google, por sua vez, diz que tem estado “muito atento aos direitos autorais e aos acordos de parceria” no treinamento do Lyria 3, e o modelo evita deliberadamente imitar artistas específicos – se você nomear um rapidamente, Lyria o interpreta como uma inspiração de humor, em vez de uma instrução direta.
Do lado da segurança e transparência, todas as faixas geradas no Gemini vêm incorporadas com SynthID, a marca d’água imperceptível de IA do Google. A empresa também adicionou verificação de áudio ao Gemini: você pode fazer upload de uma faixa e perguntar se ela foi feita pela IA do Google. Esse tipo de ferramenta de proveniência é cada vez mais importante à medida que o áudio gerado por IA inunda as plataformas de streaming – a Deezer já implantou ferramentas de detecção para identificar e sinalizar streams falsos de música de IA.
Lyria 3 está disponível hoje para desktop para todos os usuários do Gemini com 18 anos ou mais em inglês e em vários idiomas adicionais. O celular será lançado nos próximos dias. Os assinantes do Google AI Plus, Pro e Ultra obtêm limites de geração mais altos. O modelo também está expandindo o recurso Dream Track do YouTube globalmente, anteriormente apenas nos EUA, dando aos criadores de Shorts acesso a trilhas sonoras geradas por IA para seus vídeos.
Resumo Diário Boletim informativo
Comece cada dia com as principais notícias do momento, além de recursos originais, podcast, vídeos e muito mais.
Fontedecrypt




