L'IA musicale Suno valorisée 500 millions de dollars
Dix millions de personnes ont déjà généré de la musique avec Suno, indique son PDG Mikey Shulman, dans un communiqué annonçant le bouclage d’une première levée de fonds de 125 millions de dollars.
Après avoir bouclé un doctorat de physique à l’Université de Harvard, et co-signé plusieurs articles scientifiques sur l’informatique quantique dans les années 2010, Mikey Shulman1 intègre les équipes de kensho, une start-up d’intelligence artificielle américaine basée à Cambridge, dans le Massachusetts, qui développe des outils d’analyse financière à base de traitement du langage, dont il prend en charge les opérations de machine learning (apprentissage profond).
C’est dans ce contexte qu’il participe, dès 2019, à l’élaboration d’un outil speech-to-text permettant d’automatiser la retranscription textuelle des conférences téléphoniques données par les entreprises cotées en bourse lors de la présentation de leurs résultats financiers. L’expérience va conduire ce musicien semi-professionnel, qui a étudié le piano, appris à jouer de plusieurs instruments de musique en autodidacte, et écumé les bars concerts de sa région avec plusieurs formations musicales, à se lancer dans le développement d’une IA générative de musique.
“Nous avions lancé un projet open source appelé Bark2, un modèle de synthèse vocale qui fut très bien accueilli par la communauté, avec beaucoup d'étoiles sur Github. Nous avons demandé aux gens ce qui les intéressait le plus [en matière d’IA appliquée à l’audio], et ils nous ont majoritairemet répondu que c’était la musique. […] Quand toute la communauté vous appelle à faire de la musique, c'est un signal très fort ”, confait-il récemment sur Youtube à Michael Mignano3, cofondateur de la plateforme de podcasting Anchor rachetée par Spotify, dont il fut le responsable “talk audio”, et partenaire associé du fonds de capital risque californien Lightspeed Venture.
Courant 2022, Mikey Shulman est rejoint par trois acolytes de chez Kensho, Georg Kucsko, Martin Camacho et Keenan Freyberg, comme lui tous musiciens, pour se lancer dans le développement d’une IA musicale générative baptisée Suno (terme qui signfie “écouter” en hindi). L’IA de synthèse vocale Bart, modèle texte-audio universel de type Tranformer qu’ils ont déjà développé, et qui excelle dans la génération de discours multilingues très réalistes, de bruits de fond ou de simples effets sonores, va leur servir de première brique.
Continuez votre lecture avec un essai gratuit de 7 jours
Abonnez-vous à @music_zone pour continuer à lire ce post et obtenir 7 jours d'accès gratuit aux archives complètes des posts.