Accueil / Intelligence / Google lance aujourd’hui Lyria 3, son modèle d’intelligence artificielle de musique dans Gemini

Google lance aujourd’hui Lyria 3, son modèle d’intelligence artificielle de musique dans Gemini

Grosse surprise : le modèle de musique IA Lyria 3 de Google arrive dans Gemini aujourd’hui

Le poète américain Henry Wadsworth Longfellow appelait la musique « le langage universel de l’humanité ». Cela reste-t-il vrai lorsque la soi-disant musique est générée par un robot probabiliste au lieu d’un être humain ? Nous sommes sur le point de le découvrir. Google a annoncé que son dernier modèle IA Lyria 3 est déployé dans l’application Gemini, élargissant considérablement l’accès à la génération de musique par IA.

Google DeepMind peaufine Lyria depuis un moment déjà, offrant un accès limité dans des produits orientés développeurs comme Vertex AI. Lyria 3 est plus performant que les versions précédentes, et il est également plus rapide à utiliser. Il suffit de sélectionner la nouvelle option « Créer de la musique » dans l’application Gemini ou l’interface web pour commencer. Vous pouvez décrire ce que vous voulez et même télécharger une image pour aider le robot à obtenir la bonne ambiance. Et en quelques secondes, vous obtenez de la musique (ou quelque chose qui y ressemble).

Au cas où il y aurait une quelconque incertitude quant à savoir si les morceaux Lyria comptent toujours comme une création artistique humaine, ne vous inquiétez pas ! Contrairement aux versions précédentes du modèle, vous n’avez même pas à fournir des paroles dans votre requête. Vous pouvez être vague dans votre demande, et le modèle créera des paroles appropriées pour la chanson de 30 secondes. Bien qu’avec cette limite, « jingle » soit peut-être plus précis.

En plus du morceau, chaque création musicale sera accompagnée d’une image de style pochette d’album créée par le modèle Nano Banana. Gemini aura également un ensemble préchargé de morceaux IA que vous pourrez choisir de remixer à votre guise. Les outils Lyria 3 arrivent également dans la boîte à outils Dream Track de Google pour YouTube Shorts, ce qui s’associera parfaitement avec les options vidéo IA Veo.

Alors, quel genre de morceaux pouvez-vous vous attendre à ce que Gemini produise ? Google a fourni quelques exemples :

« Sweet Like Plantain »

Invite : Je me sens nostalgique. Crée un morceau pour ma mère sur les bons moments que nous avons passés enfants et les souvenirs de ses bananes plantains faites maison. Fais-en un morceau afrobeat amusant avec une vraie ambiance africaine.

« Motown Parody »

Invite : Soul Motown typique des années 1970. Production R&B orchestrale luxuriante. Ligne de basse chaleureuse avec des remplissages mélodiques, verrouillée dans un groove de batterie régulier avec une caisse claire nette et un tambourin. Lit harmonique d’orgue vintage. Section de cuivres à trois. Lead ténor masculin granuleux teinté de gospel.

« Pop Flutter »

Invite : Mélancolique et aéré. Voix féminines douces et murmurées avec intimité. Rythme drum and bass rapide, adouci par filtre passe-bas. Montées de basse profondes et chaleureuses. Accords de piano électrique rêveurs et textures subtiles de carillons. Ambiances de ville pluvieuse.

« Sea Shanty »

Invite : Une chanson de marins a capella authentique mettant en vedette un chœur masculin robuste chantant dans un format traditionnel d’appel et réponse. La pièce est entièrement vocale, s’appuyant sur des coups de pied synchronisés sur un pont en bois et des claquements de mains vifs pour fournir l’impulsion rythmique. Le lead est un baryton masculin usé avec un timbre granuleux qui chante les lignes narratives « chantées ». Il est immédiatement suivi par un chœur masculin puissant chantant en harmonie riche et rugueuse sur les lignes de « réponse ». Les voix sont enregistrées avec une réverbération naturelle qui simule l’environnement acoustique du pont d’un navire en bois, donnant aux voix une qualité résonnante et atmosphérique. La performance est énergique et dynamique, avec le chœur qui s’appuie sur le rythme des coups pour créer un sentiment d’effort communautaire et concentré. Il n’y a pas d’instruments, seulement les textures superposées de voix masculines collectives couvrant les tessitures de ténor, baryton et basse, toutes contribuant à un son confiant et monolithique.

Fausses notes

La musique générée par IA n’est pas un phénomène nouveau. Plusieurs entreprises proposent des modèles qui ingèrent et homogénéisent la musique créée par des humains, et les morceaux résultants peuvent sembler remarquablement « réels », bien qu’un peu surproduits. Les services de streaming ont déjà été inondés de faux artistes IA, dont certains ont rassemblé des milliers d’auditeurs qui ne réalisent peut-être même pas qu’ils se déhanchent sur l’équivalent musical d’un mixeur réglé sur purée.

Pourtant, il faut rechercher des outils comme ceux-là, et Google apporte des capacités similaires à l’application Gemini. En tant que l’une des plateformes IA les plus populaires, nous sommes probablement sur le point de voir beaucoup plus de musique IA sur Internet. Google affirme que les morceaux générés avec Lyria 3 auront une version audio de SynthID de Google intégrée. Cela signifie que vous pourrez toujours vérifier si un élément audio a été créé avec l’IA de Google en le téléchargeant sur Gemini, de manière similaire à la façon dont vous pouvez vérifier les images et vidéos pour les balises SynthID.

Google affirme également avoir cherché à créer une IA musicale qui respecte les droits d’auteur et les accords de partenariat. Si vous nommez un artiste spécifique dans votre requête, Gemini ne tentera pas de copier le son de cet artiste. Au lieu de cela, il est formé pour prendre cela comme une « large inspiration créative ». Bien qu’il note également que ce processus n’est pas infaillible, et qu’une partie de cette expression originale pourrait trop imiter un artiste. Dans ces cas, Google invite les utilisateurs à signaler ce type de contenu partagé.

Lyria 3 entre en service dans l’interface web de Gemini aujourd’hui et devrait être disponible dans l’application mobile d’ici quelques jours. Il fonctionne en anglais, allemand, espagnol, français, hindi, japonais, coréen et portugais, mais Google prévoit d’ajouter d’autres langues bientôt. Bien que tous les utilisateurs aient un certain accès à la génération de musique, ceux qui ont des abonnements AI Pro et AI Ultra auront des limites d’utilisation plus élevées, mais les spécificités ne sont pas claires.

Répondre

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *