Le collectif Archive Team a commencé à copier les données de SoundCloud, juste au cas où…

Alors que SoundCloud semble temporairement sauvé grâce à Chance the Rapper, un collectif d’archivistes a entamé une opération de clonage des données.

soundcloud-conseils-promotion

Depuis la fin de la semaine passée, le feuilleton SoundCloud agite la sphère des mélomanes : le 14 juillet, à la suite d’un article paru dans TechCrunch, on vous expliquait que l’entreprise, apparemment en grande difficulté financière, n’avait plus que 80 jours à vivre, et on commençait déjà à écrire l’hagiographie de la plus grande discothèque indé du Web. Deux jours plus tard, coup de théâtre : Chance the Rapper, personnellement concerné par le destin du site, trouvait un accord financier avec son fondateur Alex Ljung pour remettre le site à flot malgré des pertes financières faramineuses en 2014 et 2015 et le licenciement, début juillet, de 173 salariés.

Publicité

Fin de l’histoire ? Pas tout à fait. Échaudé par la propension de SoundCloud à se ruiner et, surtout, par son apparente absence de plan de sauvegarde de sa formidable bibliothèque musicale, le collectif d’archivistes numériques Archive Team a décidé de prendre les choses en main : depuis le 18 juillet, le collectif s’est lancé dans une grande opération de sauvegarde des données hébergées sur les serveurs de SoundCloud, soit plus de 135 millions de titres (du moins pour l’accès gratuit).

Et quelle taille fait cette collection ? Selon Amazon Web Services, qui mettait fièrement en avant SoundCloud pour illustrer la capacité de stockage de son service de cloud Amazon Glacier, le site recensait 2,5 pétaoctets de données, soit 2 500 téraoctets, en 2014. En avril 2017, selon The Verge, la collection aurait réduit de deux tiers, et il n’y aurait plus "que" 855 téraoctets de fichiers MP3 à 128 kilobits/seconde. Dans tous les cas, ça fait un sacré volume à déménager.

Une opération à 3 millions de dollars ?

Archive Team, un modeste collectif d’environ 150 personnes, s’est donc lancé dans une mission d’ampleur biblique. Pour le moment, une page dédiée a été créée sur son site… et c’est à peu près tout. Car, à partir de là, se dressent une somme de difficultés techniques, la première d’entre elles étant financière. Sur Twitter, Jason Scott, le coordinateur du collectif à l’origine de l’opération, a rapidement fait redescendre tout le monde sur Terre : en l’état actuel des choses, son équipe ne parviendra pas à dupliquer toute la collection de SoundCloud, la faute à des coûts de stockage prohibitifs.

Publicité

À notre échelle individuelle, nous avons tous l’impression que le stockage de données ne coûte plus rien (et c’est vrai qu’aujourd’hui, 100 téraoctets d’espace cloud s’achètent avec un petit billet mensuel), mais comme rétorque Jason Scott dans un tweet adressé à ceux qui voyaient déjà la fameuse plateforme Internet Archive accueillir un clone de SoundCloud : "Les gens, on parle d’un pétaoctet de musique, là."

Selon ses estimations, louer 1 pétaoctet d’espace de stockage sur les serveurs d’Archive.org, l’ONG qui gère l’Internet Archive, occasionnerait une dépense de 1,5 à 2 millions de dollars (1,3 à 1,7 million d’euros). Si SoundCloud possède toujours 2,5 pétaoctets de données, l’opération pourrait donc coûter entre 3,75 et 5 millions de dollars (entre 3,5 et 4,3 millions d’euros). Autant dire qu’un financement participatif ne sera pas du luxe.

"Si nous ne pouvons sauver qu’une portion des données, nous visons les premières années"

Contacté par Motherboard, Jason Scott détaille l’agenda de son équipe pour les jours et semaines à venir. Premièrement, dans le cas d’une "baleine" comme SoundCloud (un site renfermant de gigantesques volumes de données), l’Archive Team "effectue une évaluation de ce qui se trouve sur le site, essaie d’appréhender la taille [des données] et effectue des tests pour savoir dans quelle mesure elle peut sauver les données du site mourant." Il précise : "C’est ce que nous faisons avec SoundCloud en ce moment."

Publicité

Pour le moment, donc, le grand exode n’a pas réellement débuté (même si Jason Scott annonçait, le 14 juillet, que son ArchiveBot collectait "10 000 heures d’audio par jour") mais quand il débutera, les membres d’Archive Team devront bien commencer quelque part. "Si nous ne pouvons sauver qu’une portion des données, nous visons habituellement les premières années (là où les données ont le moins de chances d’exister ailleurs) et les fichiers les plus populaires (qui briseront le plus de liens s’ils disparaissent ou deviennent introuvables)", explique le collectif dans un mail à Motherboard.

Pour mener à bien la mission de sauvetage de la collection "en danger", l’Archive Team aura cependant besoin de dons – et là, c’est à vous d’intervenir, en filant un petit coup de pouce à l’Internet Archive. À moins que Chance the Rapper n’apparaisse à nouveau sans prévenir avec un carnet de chèques.

Par Thibault Prévost, publié le 18/07/2017

Pour vous :