Dans le dédale des IA musicales voice-to-voice
Le champ des possibles ouvert par la profusion de nouvelles IA musicales voice-to-voice ne cesse de défrayer la chronique. Mais le phénomène pourrait montrer rapidement ses limites.
Il faut être un peu geek sur les bords pour installer sur son ordinateur un logiciel d’intelligence artificielle comme Voicepaw (également connu sous le nom de so-vits-svc-fork)1, et suivre pas à pas un des nombreux tutoriaux disponibles sur Youtube avant d’en tirer parti2. Ce puissant logiciel libre, développé sur GitHub, permet d'entraîner son propre modèle d'intelligence artificielle pour lui faire interpréter les chansons de son choix avec n’importe quelle voix.
Voice-to-voice AI
“Je ne savais même pas que c'était possible", confie Bobby Geraghty3, le chanteur du groupe de rock anglais Breezer, dont l’unique album sorti en 2021, très fortement influencé par la musique d’Oasis, n’a pas connu le succès escompté. Jusqu’à ce que lui vienne l’idée de coller la voix du chanteur d’Oasis Liam Gallagher sur ses huit titres originaux - après être tombé sur la chaîne d’un Youtubeur se présentant sous le nom de Jek Spek4, qui l’avait lui-même transposée sur une quarantaine de chansons interprétées à l’origine par son frère Noel en se servant de ce logiciel.
Postée sur Youtube mi-avril dernier sous le titre AISIS - The Lost Tapes / Vol 1 (In Style of Oasis / Liam Gallagher - AI Mixtape/Album), la vidéo qui compile ces nouvelles versions des chansons de Breezer, composées par Bobby Geraghty et le guitariste du groupe Chris Woodgates, avait enregistré près de 500 000 vues en l’espace d’un mois. “Nous l’avons fait pour rire, et c’est devenu incontrolable”, explique t-il. Interrogé sur Twitter par des fans d’Oasis, Liam Gallagher a plutôt bien pris la chose. “C’est fou à lier, le son est énorme”, a t-il réagi, indiquant cependant qu’il n’avait écouté qu’un seul des huit titres5.
Postée sur Youtube mi-avril dernier, la vidéo de l’album Aisis de Breezer avait enregistré près de 500 000 vues en l’espace d’un mois.
Quelques semaines auparavant, le DJ français David Guetta avait créé un petit buzz sur Twitter en postant une courte vidéo de 50 secondes filmée lors d’une de ses performances, au cours de laquelle il introduisait une de ses chansons avec une sentence générée par une intelligence artificielle singeant la voix du rappeur américain Eminem6. “C'est une blague que j'ai faite. Et ça a tellement bien marché que je n'arrivais pas à y croire", a t-il expliqué7. “j'ai fait écouter l’enregistrement et les gens sont devenus fous !”
Fake Drake AI Album
Au début du mois d’avril, un producteur anonyme répondant au pseudo de Ghostwriter a défrayé la chronique en postant sur les plateformes de streaming une chanson originale intitulée Heart On My Sleeve, avec les voix artificielles des rappeurs Drake et TheWeeknd. Devenue très vite virale, elle fut écoutée par des dizaines de millions de personnes avant qu’Universal Music, maison de disques des deux artistes, n’exige et n’obtienne son retrait8.
Vidéo de la chanson Heart on My Sleeve du producteur anonyme Ghostwriter, avec les voix artificielles des rappeurs Drake et The Weeknd
Bien que Youtube ait rapidement obtempéré, à l’instar de Spotify, Soundcloud ou Apple Music, la chanson Heart On My Sleeve ne cesse de ressurgir sur la plateforme de streaming vidéo de Google. Le 12 mai dernier, le dit Ghostwriter, non content de l’avoir lui-même repostée, mettait en ligne sur Youtube, et sur le site de partage de musique Audiomack9, un faux album de Drake de 14 titres, Sincerely, Aubrey, avec cette fois-ci une dizaine de voix artificielles en featuring (dont celles de Lil Baby, Kanye West, Rihanna et Travis Scott).
Vidéo du faux album de Drake Sincerely, Aubrey réalisé par le producteur anonyme Ghostwriter, avec les voix artificielles de plusieurs artistes connus en featuring.
AI Covers
Plusieurs outils d’IA accessibles sur le Web et d’utilisation relativement simple, comme aicoversongs.com10, voicify.ai11, musicfy.lol12, voqul.io13 ou x-minus.pro14, qui permettent d’isoler une voix à partir d’un fichier audio ou de l’extraire pour la remplacer par une autre, ont favorisé l’apparition sur Youtube d’une multitude de AI Covers - des reprises de chansons commerciales réalisées avec d’autres voix que celle de leur interprète original - sur des chaînes comme YeezyBeaver15, AI Edits16, Hot AI Music17 ou Vintage Vibes AI18.
Une version de la chanson Easy On Me d’Adele chantée par la voix artificielle d’Ariana Grande.
Dans une playlist Youtube composée pour les besoins de cet article19, Les Beatles reprennent Oasis et les Beach Boys ; Paul McCartney reprend les Rolling Stones et Nirvana ; Freddy Mercury reprend les Beatles et Aerosmith ; Michael Jackson reprend TheWeekend ; et Curt Cobain reprend Radiohead... ce sont quelques unes des AI Tracks (des covers réalisées grâce à l'intelligence artificielle) qui affluent ces dernières semaines sur Youtube. Le résultat n’est pas toujours très probant, même s’il peut parfois s’avérer convaincant. La comparaison peut être faite, grâce à une playlist Spotify concoctée à cette fin20, avec les versions originales de ces chansons.
Reprise de la chanson Hey There Delilah du quintet Plain WhiteT’s avec la voix artificielle de Kaynie West
Même s’il suffit de quelques dizaines de secondes pour générer un petit morceau de rap avec la voix de la chanteuse canadienne Grimes grâce à un outil comme Uberduck.ai21, l’exercice a cependant ses limites. L’échantillon des voix que ces intelligences artificielles accessibles sur le Web ont déjà été entrainées à traiter reste assez limité, et les entrainer soi-même à traiter d’autres voix avec des outils de SVC (Singing Voice Conversion, ou conversion de voix chantée) n’est pas à la portée du premier venu.
Un phénomène anecdotique ?
“Il vaut mieux avoir une voix qui ressemble beaucoup à celle de l'artiste que l'on veut imiter”, indique le youtubeur Sam Smyers, qui soupçonne Ghostwriter d’avoir utilisé ce genre d’outil pour réaliser la chanson Heart on My Sleeve, dans une vidéo où il explique comment faire sonner sa voix comme celle de Drake, de The Weeknd ou de Taylor Swift en utilisant l'IA22. La pratique semble avoir peu de chances de se répandre à court terme dans le grand public, et le phénomène toutes les chances de rester anecdotique. D’autant que dans le cas de Breezer, comme dans celui de Ghostwriter, le renoncement à leur propre identité et personnalité artistique que la figure impose, et le peu de bénéfice qu’ils sont susceptibles d’en tirer, ne laissent pas d’interroger.
Plus problématique est certainement, pour l’industrie musicale, dans un contexte où l’écoute de musique devient de plus en plus passive et pilotée par des algorithmes, et où elle reste monétisée au prorata des écoutes sans autre forme de distinction, la profusion de musiques d’ambiance ou contextuelles produites à moindre coût par des intelligences artificielles sur les plateformes de streaming, qui viennent concurrencer de manière déloyale celles produites par de vrais artistes. Mais c’est une autre affaire.
Meet Breezer, The Band Behind The AI Oasizs Album, Monster Children, 14 mai 2023
Liam Gallagher Isn’t Mad About Oasis AI Album ‘AISIS,’ In Fact He Thinks He Sounds ‘Mega’, Billboard, 19 avril 2023
David Guetta: "The future of music is in AI", Music Radar, 14 février 2023
Universal Music Group responds to ‘fake Drake’ AI track, Music Business Worldwide, 17 avril 2023
Du côté du grand public, c'est plutôt sur Tiktok ou Instagram que ça va se passer, s'ils intègrent les outils d'IA nécessaires et les mettent à la disposition des utilisateurs.
A noter quand même que vu la qualité des AI albums de Breezer et Ghostwriter (sachant qu'ils en sont les auteurs-compositeurs, à défaut d'en être les interprêtes principaux, quoique la question se pose), je pense que l'industrie musicale doit intégrer cette nouvelle dimension de l'IA voice-to-voice.
Autant je ne crois pas à des applis grand public, du moins dans l'immédiat, autant je pense que c'est un nouveau chant de production musicale qui s'ouvre, et que les les labels devraient imaginer de nouvelles licences autorisant l'usage de la voix de leurs artistes.
Au demeurant, je trouve que l'artiste canadienne Grimes a fait fort, en fixant une clé de partage des revenus de 50/50 avec tout utilisateur de sa voix. Dernière remarque : sans système de blockchain intégré, ça va être compliqué à gérer.