O Gemini passou a integrar o Lyria 3, o mais recente modelo de música generativa do DeepMind. Este modelo permite criar faixas musicais a «partir de uma simples descrição ou do carregamento de uma fotografia ou vídeo».
Um pedido como uma «balada de R&B cómica sobre uma meia que encontra o seu par» é suficiente para gerar, em «poucos segundos, uma faixa com letra, voz e produção completas», garante a Google. Face à versão anterior, a empresa destaca três melhorias: a principal será o facto de deixar de ser «necessário fornecer letras, uma vez que são geradas automaticamente com base no comando».
Com o Lyria 3, os utilizadores passam ainda a ter «maior controlo criativo sobre estilo, voz e tempo» e podem criar «composições mais realistas e musicalmente complexas». Caso usemos vídeos ou imagens, o Gemini compõe «música alinhada com o ambiente visual».
As músicas criadas têm trinta segundos, incluem capas personalizadas geradas pelo Nano Banana (como se fossem singles de um álbum), podem ser descarregadas logo após a criação e vêm com um link. A Google faz ainda uma ressalva: «O objectivo não passa por produzir obras-primas musicais, mas por oferecer uma nova forma de expressão criativa, rápida e acessível».