Les maths derrière ton classement : comment fonctionne le système Elo de Tchoozit
Un système de classement ne se contente pas de compter les victoires. Derrière chaque duel, il y a des probabilités, des coefficients adaptatifs et un double classement personnel et communautaire. Voici comment ça marche, avec les vraies formules.
Tu cliques sur un jeu dans un duel. Le gagnant monte, le perdant descend. Simple, non ?
En surface, oui. Mais sous le capot, chaque clic déclenche un calcul qui prend en compte l'écart de niveau entre les deux jeux, leur expérience respective, le critère sur lequel tu les compares, et même la maturité de ton propre pool. Le système qui fait tout ça s'appelle Elo, et il a une histoire fascinante.
D'où vient le système Elo ?
En 1960, un physicien hongrois du nom d'Arpad Elo a proposé un système de classement pour les joueurs d'échecs. Son idée partait d'un constat simple : les classements existants comptaient les victoires et les défaites à plat, sans tenir compte de qui tu avais battu. Gagner contre le champion du monde et gagner contre un débutant, ça comptait pareil.
Elo a proposé quelque chose de plus intelligent : un système où chaque joueur a un score numérique, et où la valeur d'une victoire dépend de l'écart de score entre les deux joueurs. Battre quelqu'un de beaucoup plus fort que toi rapporte gros. Battre quelqu'un de beaucoup plus faible rapporte presque rien. Et perdre contre quelqu'un de plus faible te coûte cher.
La Fédération internationale des échecs (FIDE) a adopté le système en 1970, et il est depuis devenu le standard pour les classements compétitifs. On le retrouve aujourd'hui dans les échecs évidemment, mais aussi dans le football, le tennis de table, les jeux vidéo compétitifs comme League of Legends, et même dans des systèmes de recommandation comme celui qui te suggère des films sur Netflix.
La formule de base
Le cœur du système tient en deux formules. La première calcule le score attendu, c'est-à-dire la probabilité qu'un jeu A batte un jeu B :
E(A) = 1 / (1 + 10^((Elo_B - Elo_A) / 400))
C'est une courbe logistique. Si A et B ont le même Elo, le score attendu est 0.5 (50/50). Si A a 200 points de plus que B, son score attendu est d'environ 0.76 (76% de chances de gagner). À 400 points d'écart, c'est 0.91. L'écart est exponentiel, pas linéaire.
La seconde formule met à jour l'Elo après le duel :
Elo_nouveau = Elo_ancien + K × (résultat - attendu)
Le résultat vaut 1 pour une victoire, 0 pour une défaite. Le K-factor contrôle l'amplitude du mouvement. Un K élevé signifie que chaque duel a un gros impact. Un K bas signifie que le classement est stable et qu'il faut beaucoup de duels pour le faire bouger.
C'est élégant parce que tout est symétrique. Si un upset arrive (un jeu faible bat un jeu fort), le mouvement est amplifié naturellement par la différence entre le résultat (1) et l'attendu (faible). Le système se corrige de lui-même.
Comment Tchoozit adapte le système
Le système Elo a été conçu pour classer des joueurs d'échecs sur un seul axe : leur force de jeu. Tchoozit fait quelque chose de différent. On ne classe pas des joueurs, on classe des jeux, et on le fait sur 11 critères émotionnels différents.
Ça change fondamentalement le problème. Un même jeu peut être premier en narration et dixième en gameplay. The Witcher 3 domine peut-être sur l'immersion, mais Mario Kart l'écrase sur le fun entre amis. Chaque critère a son propre univers Elo, complètement indépendant des autres.
Double classement : personnel et communautaire
Chaque duel met à jour deux classements en parallèle :
-
Ton classement personnel : comment toi tu classes tes jeux, basé uniquement sur tes propres votes. C'est ton opinion, quantifiée.
-
Le classement communautaire : la synthèse de tous les votes de tous les utilisateurs. C'est le consensus collectif.
Les deux utilisent la même formule Elo, mais de manière indépendante. Ton vote personnel met à jour ton Elo personnel, et contribue aussi au pot commun du classement global. Tu peux ensuite comparer les deux pour voir où tu te démarques de la communauté.
K-factor adaptatif (11 niveaux)
Aux échecs, la FIDE utilise trois niveaux de K-factor : K=40 pour les nouveaux joueurs, K=20 pour les joueurs en dessous de 2400, et K=10 pour les joueurs au-dessus de 2400.
Chez Tchoozit, on utilise 11 niveaux, calibrés sur le nombre de duels auxquels un jeu a participé sur un critère donné :
| Duels joués | K-factor | Comportement | |---|---|---| | 0 à 1 | 96 | Découverte : chaque duel a un impact massif | | 2 à 3 | 80 | Le jeu commence à trouver sa zone | | 4 à 6 | 64 | Ajustement rapide | | 7 à 10 | 52 | Convergence | | 11 à 15 | 44 | Le classement se stabilise | | 16 à 25 | 36 | Corrections modérées | | 26 à 40 | 28 | Position établie | | 41 à 60 | 22 | Mouvements fins | | 61 à 100 | 16 | Quasi stable | | 101 à 200 | 12 | Très stable | | 200+ | 10 | Ancré |
Pourquoi 11 niveaux au lieu de 3 ? Parce que la transition entre "nouveau" et "établi" n'est pas binaire. Un jeu avec 5 duels n'est pas dans la même situation qu'un jeu avec 50. La granularité permet une convergence progressive : les premiers duels comptent énormément (K=96, presque 10 fois le K final), puis l'impact diminue graduellement jusqu'à ce que le classement se stabilise.
C'est crucial pour l'expérience utilisateur. Quand tu ajoutes un nouveau jeu à ton pool, tu veux qu'il trouve sa place rapidement. Pas après 200 duels, mais après 10 ou 15. Le K-factor élevé au début rend ça possible.
Multiplicateur "pool jeune"
Il y a un dernier ajustement qui n'existe que dans le classement personnel : le multiplicateur pool jeune.
L'idée : quand un utilisateur vient de commencer et n'a que quelques votes, chaque vote devrait compter davantage pour accélérer la convergence du classement. La formule est simple :
multiplicateur = 1 + max(0, 1 - ratio / 5) × (2 - 1)
Où ratio = nombre de votes / taille du pool. Quand le ratio est à zéro (tu viens de commencer), le multiplicateur est à 2x. Quand tu atteins 5 votes par jeu en moyenne, le multiplicateur redescend à 1x et n'a plus d'effet.
Ce boost ne s'applique pas au classement communautaire, uniquement au classement personnel. Ça permet à ton classement perso de se construire rapidement sans fausser le classement global.
Le matchmaking : pas n'importe quels duels
Un bon système Elo ne suffit pas si les duels sont mal choisis. Opposer systématiquement le premier du classement au dernier ne produit pas de duels intéressants : le résultat est joué d'avance, et le mouvement Elo est négligeable dans les deux sens.
C'est exactement le problème que le matchmaking par proximité Elo résout dans les jeux compétitifs : on essaie de mettre face à face des adversaires de niveau comparable, parce que c'est là que les duels sont les plus informatifs.
Tchoozit utilise un principe similaire. Le système favorise les paires de jeux dont les Elo sont proches sur le critère du duel en cours. Un duel entre deux jeux à 1550 et 1580 est beaucoup plus utile qu'un duel entre un jeu à 1800 et un à 1200, parce que le premier a une vraie chance de faire bouger le classement dans un sens ou dans l'autre.
Ça ne veut pas dire que les duels déséquilibrés n'arrivent jamais. Le système les permet, avec une probabilité plus faible. Ça garantit que même les jeux en bas du classement finissent par affronter ceux du haut, ce qui est important pour la précision à long terme.
La fiabilité : quand le classement devient significatif
Un classement Elo avec 3 duels n'est pas fiable. Un classement avec 50 duels par critère commence à raconter quelque chose de réel.
Tchoozit utilise un indice de fiabilité sur une échelle de 0 à 9, basé sur le nombre moyen de duels par critère. C'est ce qui détermine, par exemple, si un jeu est éligible pour les pages de comparaison, ou si son classement est affiché avec une indication de confiance.
La fiabilité n'est pas une formule magique. C'est juste un rappel honnête : un classement est aussi bon que les données qui le nourrissent.
Pourquoi ça marche
Le système Elo fonctionne parce qu'il encode une vérité fondamentale sur les préférences humaines : elles sont relatives, pas absolues. Tu ne sais pas si Outer Wilds est un 9.2 ou un 8.7. Mais tu sais que tu le préfères à Firewatch sur l'exploration, et que c'est l'inverse sur la narration.
En accumulant ces micro-décisions sur 11 axes différents, le système construit un portrait nuancé de tes goûts. Pas une note, pas un tier, mais un profil. Et c'est exactement ce que les systèmes de classement traditionnels ne peuvent pas faire.
Curieux de voir les maths en action ? Tes premiers duels t'attendent sur Tchoozit. Chaque clic nourrit le système, et ton classement se construit en temps réel.