La chasse aux musiques générées par l'IA s'organise
Qu'ils s'appuient sur l'identification d'artefacts propres à chaque modèle ou sur des méthodes de Content ID, les outils de détection de musiques générées par l'IA se multiplient.
Selon Deezer, environ 10 000 pistes musicales totalement générées par l'IA sont livrées quotidiennement sur sa plateforme, soit environ 10% du contenu livré chaque jour. Une profusion qui vient concurrencer de manière déloyale les productions de vrais artistes, et pourrait capter près du quart (24 %) des revenus des auteurs, compositeurs et éditeurs de musique collectés par les sociétés de gestion collectives dans le monde en 2028, selon une étude de la CISAC1.
Soucieuse d’endiguer le phénomène, la plateforme de streaming française a développé une méthode de détection de ces “musiques synthétiques” générées par des modèles comme Suno2 ou Udio3, qui va lui permettre de les étiqueter comme telles, dans un souci de transparence à l’égard de ses utilisateurs et de protection des droits des créateurs. Afin d’éviter leur mise en avant inopinée, sans pour autant les interdire complètement, Deezer envisage de les exclure systématiquement de ses recommandations algorithmiques et éditoriales.
Selon la plateforme, qui a déposé deux demandes de brevet en décembre 2024 pour protéger sa technologie, cette dernière est efficace à 99,8 %. Les auteurs de l’article de recherche qui la documente4, Darius Afchar, Gabriel Meseguer-Brocal et Romain Hennequin, soulignent cependant que les résultats initiaux, bien que prometteurs, ne doivent pas masquer les problèmes de robustesse et de généralisation à des générateurs inconnus qui se posent, lesquels peuvent affecter l'efficacité et la fiabilité de ce genre d’outils.
La méthode développé par Deezer s’appuie sur la détection d’”artéfacts” propres aux différents modèles, qu’elle définit comme des caractéristiques spécifiques apparaissant lors du processus de génération de musique. “Chaque auto-encodeur utilisé pour générer de la musique introduit des artefacts spécifiques à sa propre architecture et à son entraînement”, indiquent les auteurs, qui reconnaissent cependant que la présence ou l'absence de ces artefacts n'est pas toujours simple à évaluer, les manipulations audio courantes (changement de hauteur, étirement temporel, re-encodage) pouvant les modifier, voire les effacer.
Multiplication des initiatives
L’initiative de Deezer en la matière n’est pas isolée. La start-up française Ircam Amplify, émanation de l'IRCAM (Institut de Recherche et Coordination Musique/Acoustique) créée pour trouver des débouchés industriels aux innovations de ses chercheurs, a développé son propre outil de détection et d’étiquetage dévoilé en mai dernier. L'outil d'Ircam Amplify, qui s'appuie sur l'expertise de l'entreprise en matière de recherche d'informations musicales (MIR) et sur un réseau neuronal profond, serait capable capable d’analyser 5000 titres de musique en moins d’une minute, selon la compagnie, qui le dit à même de déterminer quel modèle d’IA générative a été utilisé.
D’autres solutions de détection ont vu le jour ces derniers mois, comme celle développée par Matchtune, start-up fondée par le musicien de jazz André Manoukian et le serial entrepreneur français Philippe Guillaud. Baptisée Covernet, l'outil de MatchTune est spécifiquement conçu pour détecter la musique générée par Suno, grâce à une déconstruction de son modèle qui lui permet de reconnaître sa signature d'IA unique. Ses concepteurs le créditent d’un taux d’efficacité de 95 %. La compagnie travaille à étendre les capacités de détection de Covernet à d'autres modèles d'IA musicales génératives comme Udio ou So-Vits.
Dans un registre similaire, la compagnie américaine Pex, spécialisée dans les technologies de “Content ID” faisant appel à des procédés de “fingerprinting” (empreinte numérique) pour identifier les musiques du commerce exploitées sans autorisation préalable sur les réseaux sociaux et les plateformes UGC (User Generated Content)5, a développé une méthode de détection qui s’appuie à la fois sur ses technologies d’dentification vocale et de reconnaissance automatique de contenus. Cette combinaison permet d'identifier des reprises avec des voix générées par l'IA, même si les styles vocaux et les genres sont différents.
Une autre start-up américaine, Pro-Rata, prétend de son côté avoir développé une technologie propriétaire permettant d'analyser le contenu produit en sortie par un modèle d'IA générative6, et d'identifier précisément les sources ayant contribué à sa génération, ce qui est réputé techniquement très difficile voire impossible dans la plupart des cas. ProRata, qui est encore en attente de la validation de plusieurs demandes de brevets, ne s’est jusque là pas beaucoup étendue sur la nature des méthodes algorithmiques utilisées pour parvenir à ses fins.
L'IA menace de capter un quart des revenus des auteurs-compositeurs, @music_zone, 4 décembre 2024
L'IA musicale Suno valorisée 500 millions de dollars, @music_zone, 28 mars 2024
Udio met la production musicale à portée de prompt, @music_zone, 15 avril 2024
AI-Generated Music Detection and its Challenges, Deezer Research, janvier 2025
Content ID : qui est Dubset, racheté par Pex, et qui est Pex ?, @music_zone, 11 mars 2020
ProRata s'attaque à la monétisation fractionnelle de l'IA générative,@music_zone, 7 octobre 2024