Révision des classements FIDE

Steven Bellens     25.06.2025

Source : https://lichess.org/@/Vlad_G92/blog/fide-ratings-revisited/BN89yF7d, merci à Helmut Froeyman pour le partage.

Est-ce qu’ils offrent une image complète, ou est-ce que des améliorations peuvent encore être apportées ?

0. Introduction

Je revisite les récents changements de classement de la FIDE et j’examine si le système Elo sert encore efficacement les échecs. Avec des données s’étendant de mars 2024 à juin 2025, je montre comment la déflation mondiale, la volatilité induite par les juniors et les décalages entre les fédérations exposent les failles systémiques. La rigidité du système dans un paysage échiquéen en évolution rapide exige une modernisation statistique. Décortiquons ce que les chiffres révèlent.

Le public visé est composé d’amateurs d’échecs, de joueurs de tournois et d’intervenants de la FIDE. Quelques notions de mathématiques et de statistiques te seront utiles, mais pas de plongées profondes dans les formules, je te le promets. Si tu veux passer directement à une section particulière, en voici les grandes lignes :

  1. Un système sous surveillance
  2. Contexte : Planchers, ajustements et pansements
  3. Les chiffres parlent d’eux-mêmes : La déflation est réelle
  4. Activité globale : Plus de jeux, plus de données, mais pas de meilleurs classements
  5. Pourquoi Elo s’effondre
  6. Conclusion : Un système Cotation à l’épreuve du temps ?

1. Un système sous surveillance

L’année dernière, alors que les changements étaient encore naissants, j’ai exploré les effets des nouvelles politiques de classement de la FIDE et les implications plus larges des ajustements dans le cadre standard de l’Elo. Cet article, intitulé “FIDE Cotation Changes : Are They Working So Far ?”, a fait sourciller et a suscité 5 pages entières de commentaires, ainsi que près de 20 000 vues sur Lichess ! Depuis, le calendrier des échecs s’est accéléré. De nouveaux joueurs affluent là où les fédérations investissent dans les échecs. Les tournois normaux se multiplient dans des endroits autrefois considérés comme hors des sentiers battus, tandis que les open européens deviennent attrayants pour ceux qui n’ont pas l’occasion d’affronter un éventail aussi varié de joueurs de haut niveau chez eux. Pendant ce temps, le système de classement de la FIDE continue à produire des chiffres de façon rigide et indifférente.

Le système de classement de la FIDE, fondé sur la formule Elo, était révolutionnaire à l’époque. Mais dans un monde d’échecs façonné par l’hyperactivité, la mobilité mondiale et l’accès asymétrique aux tournois, il commence à se déformer. Cet article réexamine dans quelle mesure le cadre Elo sert l’écosystème moderne des échecs et où il échoue.

2. Contexte : Planchers, ajustements et pansements

Lorsque la FIDE a adopté Elo en 1970, les classements d’échecs reflétaient un monde différent. La première liste publiée en 1971 ne comptait que 592 joueurs, tous classés au-dessus de 2200. Fischer était en tête de liste, et l’hypothèse était simple : seuls les joueurs sérieux et compétents cherchaient à être classés par la FIDE ou à se qualifier pour le faire. Cette hypothèse a tout façonné. Le plancher de 2200 n’était pas arbitraire ! Il reflétait la réalité, à savoir que les joueurs occasionnels ne participaient tout simplement pas aux événements classés par la FIDE. Le système fonctionnait parce qu’il servait un groupe homogène avec des environnements compétitifs relativement similaires.

Puis les échecs se sont démocratisés. Plus de tournois, un accès plus large, des participants plus jeunes. Le plancher de classement a dû baisser pour tenir compte de cette croissance :

  • 1993 : Le plancher est réduit à 2000
  • 2010s : Jusqu’à 1000
  • 2024 : Remontée à 1400

Chaque changement a tenté d’équilibrer l’inclusion avec l’intégrité du classement, mais a créé de nouveaux problèmes. L’abaissement des planchers a amené des joueurs plus faibles et a dilué le bassin, déplaçant toute la distribution vers le bas artificiellement, et non par une diminution de la compétence échiquéenne.

L’évolution du facteur K raconte une histoire similaire. Conservateur à l’origine (K=15-25), le système est devenu plus volatile au fil du temps. Aujourd’hui, le K=40 pour les nouveaux joueurs reflète le désespoir d’aider les classements à “rattraper” plus rapidement, mais crée de l’instabilité lorsque des joueurs expérimentés sont confrontés à de nouveaux venus. Pendant ce temps, la FIDE n’a cessé d’accélérer la fréquence de publication, passant de listes annuelles dans les années 1970 à des mises à jour mensuelles en 2012. Des mises à jour plus fréquentes signifient plus de volatilité et plus d’opportunités de manipulation des classements.

Les réformes de 2024 représentent le dernier pansement : un coup de pouce ponctuel à la notation pour les joueurs de moins de 2000 ans, le rétablissement du plafond de calcul de 400 points et une nouvelle méthode de notation initiale. Chaque changement s’attaque aux symptômes alors que l’inadéquation sous-jacente entre les hypothèses d’Elo et la réalité échiquéenne moderne persiste. Le schéma est clair : des correctifs réactifs à une incompatibilité fondamentale. Elo partait du principe que le nombre de joueurs était stable et homogène. Les échecs d’aujourd’hui se caractérisent par une participation massive, une diversité géographique et des joueurs allant des amateurs occasionnels aux professionnels de classe mondiale, le tout dans le même système d’évaluation.

Le Cotation Floor = Plafond artificiel

L’augmentation ou l’abaissement du plancher de classement n’affecte pas seulement les débutants. Il comprime l’ensemble du spectre de classement, évinçant la distinction et limitant la mobilité ascendante pour les joueurs ambitieux. Bien que les modifications du plancher de classement aient réussi à absorber davantage de joueurs dans le système, elles ont eu un impact négatif sur ceux qui aspiraient à des titres plus élevés.

J’ai trouvé un sombre rappel de cela, et implicitement de mes propres aspirations au titre, la semaine dernière en naviguant sur la plateforme de médias sociaux X. L’utilisateur Gutsy Gambit a posté la capture d’écran suivante, comparant côte à côte les distributions de joueurs actifs en juin 2015 et en juin 2025. La comparaison m’a incité à explorer plus profondément et à écrire ce suivi.

fide rating revisited 1

Même si le nombre de joueurs actifs a augmenté, les classements supérieurs à 2000 Elo n’ont cessé de diminuer – non pas à cause d’une baisse des compétences, mais à cause de défauts systémiques. Alors, peut-être qu’au lieu de rafistoler les choses toutes les quelques années, le temps est venu d’arracher le pansement ?

3. Les chiffres racontent l’histoire : La déflation est réelle

À l’heure où nous écrivons ces lignes (juin 2025), voici ce que la distribution des notes a fait depuis mars 2024 :

fide rating revisited 2

Tendance clé: De plus en plus de joueurs se regroupent autour de la barre des 1500.

fide rating revisited 3

Remarque le carambolage à 1400: il s’agit d’un artefact de la règle du plancher, et non d’une compétence réelle du joueur.

fide rating revisited 4

~3 500 nouveaux joueurs évalués selon la norme sont ajoutés chaque mois, mais l’évaluation moyenne ne cesse de diminuer.

fide rating revisited 5

La note moyenne baisse à ~1 Elo/mois, malgré une participation croissante.

fide rating revisited 6

Trois tendances se dégagent de ces données :
Déflation universelle. Même les joueurs d’élite (1 % des meilleurs) voient leur classement diminuer, ce qui indique des problèmes systématiques plutôt qu’un déclin des compétences.
Changements dans la distribution. La distribution sous-jacente devient plus asymétrique et présente un pic plus net.
Changement démographique. Les joueurs de moins de 1600 ans dominent désormais la population active, ce qui modifie fondamentalement l’écosystème des classements.

La fourchette de notation 1800-1999 est lentement remplacée par la fourchette 1400-1599

Il ne s’agit pas d’une baisse de performance, mais d’une compression structurelle. Le système Elo aplatit la complexité en simplicité, mais ce faisant, il aplatit également sa propre validité. Il réagit trop lentement pour les joueurs qui progressent rapidement et trop faiblement aux asymétries structurelles telles que les disparités géographiques et économiques. Et s’il fonctionne encore bien pour la stabilité de l’élite, la majeure partie de l’écosystème des échecs souffre de sa rigidité. Les joueurs en herbe se heurtent à des obstacles plus importants sur leur chemin vers le sommet, et les joueurs occasionnels souffrent d’un système qui est biaisé en leur défaveur.

Au cours des 20 dernières années et plus, certaines des mesures prises par la FIDE ressemblent à des solutions provisoires, et non à des solutions globales à long terme. En particulier, parmi les hauts responsables de la FIDE, il y a une croyance répandue que le système Elo est la seule solution acceptable pour que les joueurs puissent calculer leurs propres exigences pour les normes de notation des titres. Bien que je ne m’attende pas à une action immédiate, j’espère que mes arguments sont suffisamment convaincants pour susciter une réflexion et une discussion interne. Si je peux apporter une aide quelconque à ces discussions, j’y participerai volontiers.

4. Activité globale : Plus de jeux, plus de données, mais pas de meilleurs classements

Renouvellement de la popularité des échecs

Trois facteurs régissent cette recrudescence d’activité :

  • Les fermetures pour cause de pandémie et l’augmentation du travail à domicile.
  • L’émission de Netflix The Queen’s Gambit (Le jeu de la reine)
  • Plus de contenu sur les échecs sur les plateformes de livestreaming telles que Twitch et YouTube.

Si nous supposons que 2021 a été la première année où l’activité des échecs OTB a repris sérieusement, nous pouvons jeter un coup d’œil au nombre de parties jouées dans cet intervalle, le comparer aux niveaux pré-pandémiques, et également prévoir une certaine croissance future. J’ai choisi d’écarter entièrement l’année 2020 de la visualisation, car il s’agit d’une valeur aberrante évidente, avec un arrêt quasi mondial des échecs.

fide rating revisited 7

Bien que la tendance à l’augmentation post-pandémique commence à s’aplanir un peu, nous devrions encore éclipser les 3,5 millions de parties d’ici la fin de l’année 2025. La reprise n’a été rien moins qu’impressionnante, 2024 étant l’année la plus active de l’histoire, qui a coïncidé avec la célébration du centenaire de la FIDE.


Segmentations par âge

À la page 8 de son rapport complémentaire, le statisticien Jeff Sonas a présenté une segmentation en 3 bacs basée sur l’âge. Je vais refondre ici cette visualisation, qui montre les distributions de notes d’avril 2023 (avant la compression !).

fide rating revisited 8

Pour l’intervalle étroit mars-décembre 2024, je peux confirmer que cette segmentation est appropriée lorsqu’on étudie l’effet des parties jouées sur la cote d’un joueur.

fide rating revisited 9

Malgré le code couleur différent du graphique de Sonas, la relation est logique :

  • Les jeunes joueurs (améliorateurs) gagnent régulièrement en classement en jouant plus de parties, comme on peut s’y attendre
  • Les joueurs stables voient une amélioration plus faible en jouant plus de parties.
  • Les baisses perdent légèrement leur cote, comme on s’y attendait

Si tu préfères regarder des groupes d’âge plus granulaires, séparés en tranches de notation, voici cette analyse, qui s’étend de mars 2024 à juin 2025 :

fide rating revisited 10

Si j’ai réussi à convaincre les lecteurs que les jeunes joueurs sont les plus dangereux à affronter (puisqu’ils sont si sous-estimés !), les joueurs actifs du BOT devraient pouvoir s’y référer. La douleur de perdre contre un junior sous-estimé n’est que trop réelle. Pas plus tard qu’en février de cette année, j’ai perdu contre un garçon de 9 ans de l’Académie Ivanchuk en Ukraine. Il m’a surpassé du début à la fin et n’a laissé aucune trace de contre-jeu. Tu veux deviner son classement ? Bien sûr, c’était 1674


Disparités géographiques

fide rating revisited 11

Le tableau ci-dessus illustre ce que je considère comme le plus grand défi de la FIDE pour les années à venir : corriger l’énorme disparité dans la validité des classements, ou éliminer les tourbillons d’inflation/déflation des classements qui se concentrent dans des pays spécifiques.

Méthodologie : J’ai comparé les classements de la FIDE et de l’URS pour les joueurs présents dans les deux systèmes, en me concentrant sur les fédérations comptant plus de 500 joueurs pour assurer une signification statistique. Si tu veux te référer à une discussion précédente sur les raisons pour lesquelles je considère le système URS comme un bon validateur et souvent un meilleur indicateur de la véritable force de jeu, réfère-toi à cet article.

Les résultats révèlent des biais géographiques systématiques. Le Danemark présente la surévaluation la plus importante (de 162 points en moyenne), tandis que le Sri Lanka présente la sous-évaluation la plus importante (de 227 points en moyenne). Ce n’est pas une coïncidence, mais le reflet d’environnements concurrentiels fondamentalement différents.

Même Cotation, réalité différente

Un joueur classé 1800 au Sri Lanka et un autre classé 1800 au Danemark peuvent partager un nombre, mais pas un niveau de compétence. Cela se reflète dans leurs notes URS, mais Elo n’en tient absolument pas compte. Il ne s’agit pas d’une disparité isolée. C’est la norme lorsque des fédérations dont les poules sont déflatées rencontrent des fédérations dont les poules sont gonflées, et Elo n’a aucun moyen de le savoir.

Le facteur K statique et l’hypothèse d’un classement unique ont du mal à s’imposer dans cet environnement dynamique où des joueurs de diverses fédérations se mélangent lors d’événements ouverts. Pourtant, l’exemple ci-dessus n’était qu’une expérience de pensée. Dans le monde réel, cela se produit plus fréquemment qu’auparavant dans les grands tournois suisses, où le mélange des fédérations offre aux juniors des pays sous-estimés une énorme incitation à participer et à “cultiver” le classement de leurs adversaires qui ne se doutent de rien. Un exemple typique est le tournoi Sunway Sitges en Espagne, qui attire souvent de nombreux jeunes participants de l’Inde. Voici une capture d’écran de Sunway Sitges 2024:

fide rating revisited 12

Sur les ~20 joueurs indiens classés en dessous de 2000, un seul – Adarsh D – a sous-performé son classement de départ et a terminé plus bas. Cela correspond à la croyance selon laquelle les joueurs indiens amateurs sont souvent plus sous-estimés que leurs homologues professionnels (de manière anecdotique, beaucoup de joueurs de plus de 2000 dans la capture d’écran ci-dessus ont sous-performé leur classement !), et a donné lieu à un nouveau phénomène où les joueurs européens établis évitent souvent les tournois de peur d’être associés à ces adversaires extrêmement sous-estimés. Cependant, la discussion ne devrait pas se limiter à l’Inde. Les fédérations d’Asie centrale, comme le Kazakhstan et l’Ouzbékistan, disposent également d’un large éventail de juniors extrêmement talentueux. Le Kazakhstan a récemment obtenu de très bons résultats aux championnats du monde des jeunes et a envoyé davantage de délégations en Europe pour profiter de ces opportunités accrues.

Cette pression systémique des poules dégonflées qui commencent maintenant à se mélanger aux poules gonflées provoque une réduction du taux de participation des joueurs désillusionnés, et a un effet d’entraînement dans tout l’environnement de la FIDE. Je crois fermement qu’une fois que nous aurons corrigé ces disparités (par n’importe quelle intervention nécessaire !), les tournois seront plus équitables, auront une meilleure participation et conduiront à une croissance plus rapide du jeu d’échecs hors compétition dans le monde entier.

David Smerdon, grand maître connu et professeur adjoint d’économie à l’université du Queensland, réitère cette disparité géographique et y met un éclairage différent: “Ce n’est pas une question d’âge, c’est une question de nombre insuffisant de tournois de la FIDE. Les fédérations plus pauvres sont plus susceptibles d’avoir des classements déflatés parce que soumettre des tournois FIDE est coûteux. Il y a donc une corrélation entre le PIB du pays et l’inflation des classements, ce que certains pourraient trouver problématique.”

Bien que je sois d’accord pour dire qu’il existe une corrélation entre le PIB d’un pays et l’inflation des classements, je pense qu’une analyse plus approfondie, telle qu’une régression multivariée, est nécessaire pour établir quels sont les facteurs dominants. Ce que nous savons jusqu’à présent, c’est qu’un pourcentage important de jeunes joueurs actifs dans une fédération conduit souvent à une piscine dégonflée dans ce pays.


“Pas de pays pour les vieux”

fide rating revisited 13

Du diagramme du bas, il résulte qu’en 2024 les adolescents ont joué plus de parties classées FIDE que leur représentation. Il s’agit d’une tendance qui s’est accélérée après la pandémie et qui est tout à fait pertinente car elle introduit une “asymétrie du facteur K” dans le pool. S’il y a souvent un mélange entre des facteurs K asymétriques (par exemple, quelqu’un avec K=40 face à quelqu’un avec K=20), nous nous attendons à ce que les jeunes joueurs moins bien classés ajoutent une pression inflationniste dans le système chaque fois qu’ils gagnent, en extrayant le double des points de classement de leurs adversaires plus établis. Et c’est là que le bât blesse : même avec toutes ces modifications et cette asymétrie, la déflation n’a toujours pas disparu ! Cela suggère que soit les joueurs les plus établis sont plus performants lorsqu’ils affrontent des juniors (à peine !), soit qu’il y a des problèmes plus profonds avec la formule Elo.

5. Pourquoi Elo s’effondre

Les angles morts d’Elo

Un système conçu il y a plusieurs dizaines d’années pour les joueurs de haut niveau qui s’affrontent dans des tournois d’élite suppose que tous les joueurs concourent dans des conditions égales. Il ne tient pas compte des différences régionales, des disparités économiques ou de l’accès inégal aux tournois. Il tient à peine compte des rencontres inégales lorsque les joueurs sont séparés par plus de 400 points. Les conséquences ? Des distorsions de classement et des injustices généralisées.

Cet article a montré à la fois les symptômes (déflation mondiale, disparités de classement géographiques, volatilité due aux jeunes) et les causes sous-jacentes. Les hypothèses de base d’Elo ne correspondent plus à la réalité des échecs. Le système a été conçu lorsque seuls les joueurs d’élite étaient en compétition : un petit groupe motivé avec une distribution des compétences à peu près normale et dont les classements étaient tous regroupés dans un intervalle de 200 à 300 points.

Le monde des échecs d’aujourd’hui est différent. Nous avons des joueurs occasionnels aux côtés des professionnels. Cela crée une distribution à “longue queue” où les écarts de compétences sont bien plus importants qu’Elo ne le prévoit. L’hypothèse d’une distribution symétrique et logistique est remise en question par une modélisation plus réaliste via une distribution log-normale.

fide rating revisited 14

Facteurs K statiques

Ce sont des instruments émoussés. Les joueurs qui montent rapidement s’enlisent. Les joueurs en déclin s’attardent trop longtemps. Une meilleure mesure serait un paramètre de volatilité dépendant du contexte. Inactif depuis trop longtemps ? Il n’y a aucune certitude que ton évaluation soit significative. C’est là que quelque chose comme le système Glicko (mis en œuvre par l’USCF, ainsi que par les plateformes en ligne) s’impose. Il ajuste les facteurs K à travers un continuum de possibilités.

Taches aveugles géographiques et économiques

Elo ne tient pas compte de l’inflation ou de la déflation régionale, ni de l’accès aux tournois ou des disparités entre les fédérations. Un 1900 au Danemark et un 1900 au Sri Lanka ? D’après les classements URS, c’est le jour et la nuit. Elo ne voit aucune différence !

Conclusion : Un système Cotation à l’épreuve du temps ?

Les échecs ont évolué depuis 1970. Le système de notation, lui, n’a pas évolué.

Nous concourons maintenant dans un monde de tournois ouverts et de mobilité globale. Pourtant, la FIDE s’appuie toujours sur un système conçu pour des événements fermés, à la ronde, entre élites nationales. Ce système était révolutionnaire à l’époque. Aujourd’hui, il montre ses fissures. Les changements récents de la FIDE : l’ajustement unique pour les moins de 2000 ans, la réintroduction de la règle des 400 points, l’augmentation du plancher de classement à 1400, sont tous des tentatives sincères de soulagement. Mais ils restent réactifs et fondamentalement liés à une hypothèse de base vieillissante : que Elo est assez bon.

Nous n’avons pas besoin de brûler tout le système. Mais il est temps de construire quelque chose qui corresponde au monde des échecs d’aujourd’hui, avec quelques ingrédients clés tels que :

  • Flexibilité et réactivité
  • Estimation de la force contextuelle
  • Modélisation statistique qui suit la façon dont les joueurs s’améliorent réellement.

Il ne sera pas facile de remplacer Elo. Il est ancré dans nos systèmes de titres et nos listes historiques. Mais si nous tenons à l’exactitude, à l’équité et à l’objectivité totale du système de classement, nous nous devons d’analyser les choses plus en profondeur. Combien de temps un jeu moderne peut-il fonctionner avec un algorithme ancien ?

Le monde des échecs a changé. Aujourd’hui, nos horloges sont numériques et nos parties sont en ligne. Notre analyse est plus profonde que jamais avec Stockfish et Leela, tirant parti de puissants réseaux neuronaux et d’algorithmes d’apprentissage automatique. Pourtant, nos évaluations sont toujours à la traîne. Si nous voulons que l’équité suive le progrès, il est temps de se moderniser et de ne pas utiliser la même formule qu’en 1970.

Ma principale suggestion est que la FIDE commence à suivre les classements URS et les affiche bien en vue sur la page de chaque joueur pendant une période d’environ un an pour une évaluation complète. À l’avenir, il serait souhaitable d’exécuter un algorithme de type Glicko-2 en parallèle.


Remerciements: Je tiens à remercier Walter Wolf, Jeff Sonas, Ken Regan et Mark Glickman pour leurs articles, qui m’ont servi d’inspiration utile. Merci à David Smerdon, Mark Crowther et beaucoup d’autres pour leur engagement sur les plateformes sociales. Un grand coup de chapeau également à Chessdom et à son comité de rédaction pour avoir publié certains de mes documents à l’intention d’un public plus large.

Cet article a été initialement publié le 24 juin sur ma sous-page personnelle. Il s’agit d’une mise à jour pour plus de clarté et de précision.

Commentaire

Veuillez entrer votre nom complet (prénom et nom) pour laisser un commentaire. Les commentaires anonymes ne sont pas autorisés.

Plus d'articles sur classement FIDE ELO

kbsb widescreen

[mise à jour II] Des résultats FIDE erronés ont été rapportés

Steven Bellens    30.04.2025    10

Comme beaucoup l’ont vu, la FIDE a publié un nouveau classement hier (04.05.2025) dans lequel la correction des résultats incorrects…

Lire plus
FIDE ELO vs national ELO

Comparaison de l’ELO de FIDE et de l’ELO national

Cette page explique les différences entre le système de classement international de la FIDE et notre propre système national de calcul ELO. Elle s’intéresse également à nos pays voisins, et résume les informations concernant leurs systèmes et leurs méthodes de travail.

Lire plus
fide rating changes update

Changements de classement de la FIDE : Fonctionnent-ils jusqu’à présent ?

Steven Bellens    27.10.2024    4

Voici une lecture intéressante avec une analyse des 7 premiers mois après les changements de classement de la FIDE.

Lire plus
fide elo arbiter requirements

FIDE ELO – exigences de l’arbitre (4/4)

Steven Bellens    13.09.2024    1

Dans notre sondage du mois d’avril, une majorité de répondants ont indiqué leur préférence pour l’adoption d’un système de classement mondial unifié (FIDE). Afin de bien comprendre les deux systèmes, nous lançons cette série d’articles. Ceci est le dernier des quatre articles expliquant les exigences des arbitres.

Lire plus