Un guide complet des algorithmes de recommandation de Spotify
A partir des informations publiquement accessibles, le blog Music Tomorrow parvient à déméler un tant soit peu l'écheveau du système de recommandation de Spotify.
De l'analyse des métadonnées des chansons, du signal audio, des paroles, des données trouvées sur le Web et des playlists générées par les utilisateurs, à la génération de profils de goût des utilisateurs et de recommandations musicales, en s’appuyant sur le filtrage des contenus et une part de filtrage collaboratif, comment fonctionne la recommandation et la découverte musicale sur Spotify ? C’est l’écheveau que tente de déméler le blog Music Tomorrow à partir des informations publiquement accessibles.
L'objectif principal du système de recommandation de Spotify est la fidélisation, l’augmentation du temps passé sur la plateforme et la satisfaction générale des utilisateurs. Spotify utilise plusieurs modèles et algorithmes d'apprentissage automatique indépendants pour générer des représentations des éléments qui constituent son catalogue et des utilisateurs.
Les métadonnées des chansons, l'analyse de leur signal audio et les modèles NLP (Natural Language Processing) sont au coeur de la représentation des titres dans le système de recommandation de Spotify. En ce qui concerne la part de filtrage collaboratif, Spotify s’appuie sur l’analyse d’un échantillon de ~700 millions de playlists générées par les utilisateurs.
En étudiant les co-occurrences de titres dans les playlists et les sessions d'écoute, les algorithmes de filtrage collaboratif de Spotify accèdent à un niveau de détail plus profond et capturent des signaux utilisateur bien définis. La combinaison de cette approche collaborative avec celle basée sur l’analyse du contenu permet au système de recommandation de Spotify de développer une représentation holistique des titres.
À ce stade, le profil du titre est encore enrichi en combinant les résultats de plusieurs algorithmes indépendants pour générer des vecteurs de plus haut niveau (humeur, genre, style, etc.). Pour transformer ces données sur les titres et les artistes en recommandations pertinentes, le moteur doit les croiser avec les données décrivant les utilisateurs - ce qui soulève une autre question, à laquelle Music Tomorrow tente également de répondre : quelle est l'approche du profilage des utilisateurs sur Spotify ?
Lire l’article complet (en anglais) : music-tomorrow.com