Historique de Mush

L'historique de Mush correspond à deux bases de données répertoriant de manière quasi-exhaustive toutes les parties qui ont été jouées sur le jeu Mush depuis le Prologue et tous les joueurs qui ont participé à ces parties. Ces bases de donnée ont été créée par Web scraping des pages de fin publiques et des profils Twinoid des joueurs listés sur ces pages.

Parties jouées sur Mush

Cette base de donnée est organisée sous la forme d'un tableau au format CSV.
Mise à part l'en-tête, chaque ligne correspond à une partie différente. Les variables en colonnes correspondent à l'ensemble des données extraites : identifiant du vaisseau, fin de la partie, personnages présents, joueurs, messages de fin, projets et recherches accomplies, etc.

Téléchargements

  • Nombre de vaisseaux par fichier : 3000
  • Taile moyenne : 10 Mo
  • Format : text/csv
  • Encodage : UTF-8
Version anglaiseVersion espagnoleVersion française

Joueurs de Mush

Cette base de donnée est organisée sous la forme d'un tableau au format CSV.
Il est à noter que le fonctionnement de Twinoid fait que les trois versions de Mush (dans trois langues différentes) sont traitées comme trois jeux différents. Ainsi, un même compte peut exister sur les trois versions de Twinoid et jouer sur les trois versions de Mush ; un tel compte aura toujours le même identifiant, mais aura des statistiques différentes d'une langue à l'autre. L'identifiant est unique pour un même joueur, et peut exister au maximum une fois par langue.
En conséquence, mise à part l'en-tête, chaque ligne correspond à un profil d'un joueur différent sur une version du jeu différente. Les variables en colonnes correspondent quant à elles à l'ensemble des données extraites : identifiant du joueur, score et trophées.

Téléchargements

  • Nombre de joueurs par fichier : 10000
  • Taile moyenne : 4 Mo
  • Format : text/csv
  • Encodage : UTF-8
Version anglaiseVersion espagnoleVersion française

Création des bases de données

La récupération des données est faite à l'aide d'un script écrit sur-mesure en langage R et exécuté sur le logiciel RStudio. Ce script télécharge une à une les pages de fin disponibles et les profils des joueurs en testant les URLs des parties et des joueurs n°1, puis 2, puis 3, ... puis 14354, puis 14355, ... etc. Après chaque téléchargement de page, il inspecte et/ou modifie le code HTML qu'il reçoit afin d'extraire certaines données précises. Et c'est à partir de ces données qu'il peut générer des fichiers répertoriant l'ensemble des informations qu'il a trouvées, les différents personnages, les joueurs, les statistiques, les trophées, ...

La base de donnée des parties se base sur l'ensemble des pages de fin du jeu. Ces pages sont publiques et peuvent être accédées via l'URL http://mush.vg/theEnd/... (ou mush.twinoid.com, ou mush.twinoid.es, selon la version du jeu) comprenant un nombre entier correspondant à l'identifiant de la partie. Par exemple la page de fin de la partie n°34865 de la version française du jeu est accessible à l'adresse http://mush.vg/theEnd/34865.

La base de donnée des joueurs est générée grâce aux identifiants trouvés dans les pages de fins de parties. Les données sont récupérées à partir des pages de profils publiques accessibles à l'URL https://twinoid.com/../user/... comprenant en, es ou fr et un nombre entier correspondant à l'identifiant du joueur ; ainsi qu'à partir des pages de trophées publiques accessibles à l'URL https://twinoid.com/mod/userGoals/... suivie de l'identifiant des joueurs et de divers paramètres disponibles sur les pages de profils.

Date de dernière mise à jour : 27/06/2020