
Ces données ont d'abord été rassemblées à partir des notations effectuées par les utilisateurs de Yahoo! Music service sur une période d’un mois. Le relevé complet de ces données s’élevait d’abord à 250 millions de notations portant sur 100 000 artistes et réalisées par 4 millions d'utilisateurs. Les notes furent ensuite étalonnées sur une échelle de préférence de 1 (n’aime pas du tout) à 100 (n'aime beaucoup). Les données furent traitées à nouveau en éliminant tous les résultats inférieurs à 75 et en ne prenant en compte que les utilisateurs et les artistes ayant réalisé ou fait l’objet d’au moins 100 évaluations. Après cet écrémage, le nouveau corpus de données contenait 9276 artistes évalués par 150 000 utilisateurs pour un total de 2,5 millions de notations.
The World of Music n’est actuellement pas consultable en ligne. Il est possible cependant de consulter des documents de présentation. On aperçoit assez clairement les motivations d'une telle étude qui permet d'établir la liste des artistes les plus populaires (voir l'image ci-dessous "PageRank Yahoo! Launch Top 40!") . Chris Anderson dans sa théorie de la longue traîne appellerait celà la tête de la comète (best bets), en effet à peine 10 % des artistes apparaîssent dans la sélection finale.

The World of Music: SDP layout of high dimensional data (pdf)
World of Music Interactive Demo
World of Music (ppt)
Aucun commentaire:
Enregistrer un commentaire