📥 Télécharger ce sujet en PDF pour le réviser hors-ligne. Texte rédigé pour dix minutes d’exposé continu, prêt à utiliser tel quel.


Bonjour. Je vais vous parler d’une question qui me tient à cœur, et qui dépasse en réalité les échecs eux-mêmes : qu’est-ce que modéliser un objet en mathématiques, et comment savoir où s’arrête un modèle ?

Le sujet est précis : quels modèles mathématiques permettent de comprendre les échecs, et où sont leurs limites ? Cette question m’intéresse parce qu’elle adopte un point de vue méta sur le programme de spécialité mathématiques de terminale. Au lieu d’appliquer un modèle, je vais comparer plusieurs modèles et discuter ce que chacun capture, ce que chacun manque, et pourquoi aucun n’est complet.

Les échecs ont été abordés par les mathématiciens sous au moins quatre angles différents au cours du vingtième siècle : combinatoire, théorie des jeux, probabilités, et apprentissage statistique. Chaque modèle a apporté quelque chose, et chacun a montré ses limites. C’est cette histoire que je vais raconter, parce qu’elle illustre une idée plus large : la modélisation n’est jamais neutre, elle est toujours un choix qui définit autant ce qu’on voit que ce qu’on rate.

Je procéderai en trois étapes. D’abord, je présenterai les modèles déterministes : combinatoire et théorie des jeux. Ensuite, j’analyserai le modèle probabiliste, incarné par le système Elo. Enfin, je discuterai l’approche moderne par apprentissage statistique, qui abandonne en partie l’idée même de modèle explicite.

Les modèles déterministes : combinatoire et théorie des jeux

Le premier modèle, historiquement et logiquement, est combinatoire. On considère le jeu comme un objet fini : un nombre fini de positions, un nombre fini de coups, un nombre fini de parties. À partir de là, on peut tout compter.

Le résultat principal de cette approche est le nombre de Shannon, calculé en mille neuf cent cinquante : il y a environ dix puissance cent vingt parties d’échecs possibles. Ce calcul utilise le principe multiplicatif appris en terminale : facteur de branchement environ trente-cinq, profondeur moyenne quatre-vingts demi-coups, donc trente-cinq puissance quatre-vingts. C’est de la combinatoire élémentaire appliquée à un objet immense.

La limite de ce modèle est évidente : il compte sans évaluer. Toutes les parties sont mises sur un pied d’égalité, y compris celles où un joueur perd sa dame au coup deux. Le modèle combinatoire est exact mais aveugle : il décrit l’espace possible sans hiérarchiser ce qui est jouable.

Le deuxième modèle déterministe est la théorie des jeux. Avec le théorème de Zermelo, démontré en mille neuf cent treize, on prouve que les échecs ont un résultat déterminé sous jeu parfait : soit les Blancs gagnent, soit les Noirs gagnent, soit c’est nulle. Ce résultat est extraordinaire en mathématiques pures : il garantit l’existence d’une solution. Mais il ne nous dit pas quelle solution.

La limite de ce modèle est sa non-constructivité. Zermelo prouve qu’une stratégie gagnante existe, mais il ne la fournit pas. C’est une mathématique d’existence sans construction, et cette nuance est essentielle : connaître l’existence d’un objet ne suffit pas à l’utiliser. C’est exactement comme le théorème des valeurs intermédiaires : il prouve qu’une équation a une solution, mais il faut d’autres outils pour la trouver.

Ensemble, ces deux modèles déterministes nous disent : le jeu a un nombre fini de parties (dix puissance cent vingt), et il a un résultat déterminé (par Zermelo). Et pourtant, on ne sait pas quel est ce résultat, parce qu’on ne peut pas explorer l’arbre. Les modèles déterministes nous montrent à la fois la rigueur et l’impuissance des mathématiques classiques face à un objet trop grand.

Le modèle probabiliste : Elo et loi binomiale

Face à l’impossibilité d’explorer l’arbre complet, les mathématiciens ont adopté un autre point de vue : modéliser non plus le jeu lui-même, mais la performance des joueurs. C’est l’approche probabiliste, dont le succès le plus visible est le système Elo.

Le système Elo, créé par Arpad Elo dans les années mille neuf cent soixante, repose sur deux fonctions mathématiques. La première est une fonction logistique qui transforme un écart de cotes en probabilité de victoire : P(A bat B) égale un divisé par (un plus dix puissance (R_B moins R_A divisé par quatre cents)). C’est une sigmoïde, fonction étudiée au programme de terminale, qui prend toujours ses valeurs entre zéro et un.

La seconde fonction est une mise à jour de cote, qui s’écrit comme une suite récurrente : R_{n+1} égale R_n plus K multiplié par (résultat moins P). Cette suite converge vers la vraie force du joueur sous l’hypothèse de stationnarité, par application de la loi des grands nombres. C’est un beau résultat mathématique : un objet inobservable, le vrai niveau d’un joueur, est estimé de mieux en mieux à mesure que les parties s’accumulent.

Le modèle Elo a connu un succès énorme. Il est utilisé dans tous les sports compétitifs : tennis, football, esports. Il est devenu le standard de la modélisation de la performance individuelle. Mais ses limites sont réelles. Premièrement, l’hypothèse de stationnarité est fausse : les joueurs progressent ou déclinent. Deuxièmement, l’hypothèse d’indépendance des parties est fausse : une défaite peut entraîner un tilt. Troisièmement, la formule extrapole mal aux écarts extrêmes : la probabilité qu’un joueur de mille deux cents Elo batte Magnus Carlsen (deux mille huit cent cinquante) est calculée à un sur treize mille, mais cette précision est invérifiable empiriquement.

Plus fondamentalement, le modèle Elo modélise la performance, pas le jeu. Il nous dit qui va gagner avec quelle probabilité, mais pas pourquoi. Il est utile pour classer les joueurs et organiser les compétitions, mais il ne nous aide pas à comprendre les échecs en tant que jeu. C’est une limite structurelle : changer d’angle revient à changer d’objet.

Le modèle par apprentissage statistique : AlphaZero et l’abandon des formules

Le troisième modèle, le plus récent, abandonne en partie l’idée même de modèle explicite. C’est l’approche par apprentissage statistique, incarnée par AlphaZero en deux mille dix-sept.

AlphaZero ne pose pas d’hypothèses sur les échecs. Il ne calcule pas le nombre de Shannon, il ne suppose pas Zermelo, il n’utilise pas la formule Elo. Il joue des millions de parties contre lui-même et ajuste un réseau de neurones pour prédire qui va gagner depuis chaque position. À la fin, le réseau a appris quelque chose qu’aucune formule humaine n’a pu capturer.

Mathématiquement, AlphaZero est une fonction de l’espace des positions vers l’intervalle moins un, plus un. Cette fonction est paramétrée par des dizaines de millions de coefficients, ajustés par descente de gradient sur les données d’auto-jeu. L’idée centrale est que cette fonction n’est pas dérivée d’un raisonnement explicite : elle est apprise. C’est un changement de paradigme mathématique.

Pour évaluer ses performances, AlphaZero a joué cent parties contre Stockfish en deux mille dix-sept : vingt-huit victoires, zéro défaite, soixante-douze nulles. Ce résultat suggère que le modèle par apprentissage capture quelque chose que les modèles classiques ratent. Mais à quel prix ? Les limites sont importantes.

Première limite : l’opacité. On ne sait pas pourquoi AlphaZero joue tel coup. On peut voir le résultat, on ne peut pas raconter le raisonnement. C’est exactement le contraire de la mathématique classique, qui valorise la démonstration. Cette opacité pose un problème philosophique : peut-on accepter un savoir qu’on ne peut pas expliquer ?

Deuxième limite : le coût. AlphaZero a nécessité cinq mille processeurs spécialisés pendant des heures, soit plusieurs millions d’euros d’infrastructure. Cette barrière à l’entrée concentre la recherche dans quelques grandes entreprises et soulève des enjeux d’accessibilité.

Troisième limite : la non-généralité. Le modèle est spécifique : un AlphaZero entraîné aux échecs ne saura pas jouer aux dames sans réapprentissage complet. Il manque d’abstraction. Les modèles humains, malgré leurs limites, sont plus généraux : la formule du principe multiplicatif s’applique à n’importe quel jeu.

Conclusion

Pour répondre à ma question initiale, plusieurs modèles mathématiques permettent de comprendre les échecs, et chacun a ses limites précises. Le modèle combinatoire compte mais n’évalue pas. Le modèle de la théorie des jeux prouve l’existence d’une solution mais ne la construit pas. Le modèle probabiliste évalue la performance mais pas le jeu. Le modèle par apprentissage évalue le jeu mais sans explication. Aucun modèle n’est complet.

Cette observation me semble centrale en mathématiques appliquées : modéliser, c’est choisir ce qu’on regarde et ce qu’on néglige. Chaque modèle est une lentille avec ses angles morts. La pratique mathématique mûre consiste à comprendre les limites de son modèle autant que ses succès. C’est précisément cette discipline du doute qui distingue les mathématiques de la simple application de formules. Et c’est, à mon sens, ce que les échecs nous ont appris de plus profond : non pas comment gagner aux échecs, mais comment penser quand l’objet dépasse l’outil.

Je vous remercie pour votre attention et je suis prêt à répondre à vos questions.


Pour aller plus loin : Sujet Grand Oral Maths sur la combinatoire · Sujet Grand Oral Maths sur Elo et probabilités · Sujet Grand Oral Maths sur Zermelo et complexité · Hub méthodologie Grand Oral Maths