Minimax produit-il toujours le meilleur coup ?

Oui, si la recherche descend jusqu'aux positions terminales (mat ou pat). À profondeur finie avec fonction d'évaluation heuristique, minimax produit le coup optimal selon l'évaluation et la profondeur utilisées. C'est pourquoi un moteur évalué à 3500 Elo bat un humain : sa fonction d'évaluation + sa profondeur sont plus proches de la vérité que celles d'un humain, pas parce qu'il calcule "parfaitement".

Pourquoi parle-t-on de "negamax" plutôt que de "minimax" dans les codes ?

Parce que dans un jeu à somme nulle, $\min(a,b) = -\max(-a,-b)$. Negamax exploite cette symétrie pour utiliser une seule fonction récursive au lieu de deux. C'est purement une simplification du code, sans changement algorithmique. La quasi-totalité des moteurs modernes (Stockfish, Komodo, Leela Chess Zero) utilisent negamax + alpha-bêta.

L'élagage alpha-bêta change-t-il le résultat de minimax ?

Non, jamais . C'est sa propriété fondamentale : alpha-bêta produit exactement le même coup que minimax pur, mais en explorant beaucoup moins de noeuds. La force de l'élagage dépend de l' ordre des coups : si tu testes le meilleur coup en premier, tu élagues massivement ; si tu testes le pire en premier, tu n'élagues presque rien. C'est pourquoi les moteurs investissent autant dans l'ordonnancement des coups (killer moves, historique des bons coups).

Pourquoi AlphaZero abandonne-t-il minimax ?

Pas vraiment : il garde une recherche arborescente (MCTS), mais remplace l'exploration exhaustive d'alpha-bêta par une exploration probabiliste guidée par un réseau de neurones. L'avantage : sur des positions où la fonction d'évaluation classique perd pied (sacrifices à long terme, jeu positionnel subtil), le réseau de neurones donne une estimation plus juste. L'inconvénient : il faut entraîner ce réseau sur des millions de parties, ce qui demande des ressources matérielles considérables.

Mon cerveau exécute-t-il vraiment minimax quand je calcule ?

Approximativement, oui. Tu fais une recherche arborescente avec un facteur de branchement très faible (3-5 coups candidats au lieu de 35), une profondeur très limitée (3-8 demi-coups), et une fonction d'évaluation intuitive (sens positionnel). Tu utilises aussi des heuristiques d'élagage très puissantes : tu rejettes la plupart des coups en un coup d'œil sans les calculer. La différence avec un moteur n'est pas qualitative, elle est quantitative.

Algorithme minimax aux échecs : alpha-bêta, negamax et calcul des moteurs

Il y a quelque chose d'étrange dans le fait que la stratégie aux échecs, ce jeu millénaire d'intuition et d'art, puisse être réduite à un algorithme de quelques lignes. L'algorithme minimax fait exactement cela : il formalise le coeur du raisonnement stratégique dans un jeu à somme nulle en une récurrence mathématique élégante. Et ce n'est pas seulement l'âme des moteurs d'échecs modernes : c'est aussi la description formelle de ce que tu fais dans ta tête quand tu calcules. (Pour le cadre théorique général dont minimax est l'algorithme central, voir théorie des jeux aux échecs ; pour le théorème qui garantit l'existence d'une valeur à toute position, le paradoxe de Zermelo.)

L'intuition derrière minimax

Imagine que tu joues les Blancs et que tu veux choisir le meilleur coup possible. Comment le définir ? Le meilleur coup est celui qui, en supposant que ton adversaire joue aussi parfaitement, te donne le meilleur résultat final.

Cette définition récursive est l'essence de minimax. Blanc veut maximiser le résultat (du point de vue des Blancs). Noir veut minimiser le résultat (du point de vue des Blancs, ou symétriquement maximiser du sien). Les deux joueurs alternent, et à chaque niveau de l'arbre, c'est l'un ou l'autre qui joue.

La formalisation mathématique est directe :

$\text{minimax}(p, d) = \begin{cases} \text{évaluation}(p) & \text{si } d = 0 \text{ ou } p \text{ est terminal} \\ \max_{c \in C(p)} \text{minimax}(\text{succ}(p,c), d-1) & \text{si c'est le tour de Blanc} \\ \min_{c \in C(p)} \text{minimax}(\text{succ}(p,c), d-1) & \text{si c'est le tour de Noir} \end{cases}$

Où $p$ est la position courante, $d$ est la profondeur de recherche restante, $C(p)$ est l'ensemble des coups légaux en $p$ , et $\text{succ}(p,c)$ est la position résultant du coup $c$ en $p$ .

La fonction d'évaluation : le coeur du moteur

Minimax pur résoudrait les échecs parfaitement si tu pouvais explorer l'arbre complet jusqu'aux positions terminales. En pratique, c'est impossible en raison de la complexité combinatoire ( $10^{120}$ feuilles selon Shannon). Il faut arrêter la recherche à une profondeur finie et évaluer les positions non-terminales avec une fonction d'évaluation heuristique.

Historiquement, les premières fonctions d'évaluation étaient simples : comptage du matériel (dame = 9 pions, tour = 5, fou/cavalier = 3). Les moteurs modernes comme Stockfish utilisent des fonctions d'évaluation extrêmement sophistiquées qui intègrent :

La valeur du matériel : avec des tables de valeurs contextuelles qui varient selon la phase de jeu. Un cavalier vaut davantage en milieu de jeu fermé que dans une fin de partie ouverte.

La mobilité des pièces : le nombre de coups légaux disponibles pour chaque pièce. Une pièce avec plus de mobilité est généralement plus forte.

La sécurité du roi : la solidité de la structure de pions autour du roi, les lignes ouvertes vers lui, les pièces adverses menaçantes.

La structure des pions : les pions doublés (affaiblis), isolés (sans soutien), arriérés (ne pouvant plus avancer), passés (sans pions adverses sur leur chemin vers la promotion).

Le contrôle du centre : l'occupation et le contrôle des cases centrales e4, d4, e5, d5 et leurs environs.

Ces éléments sont pondérés et combinés dans une formule qui tente d'approximer la "vraie" valeur de la position.

L'élagage alpha-bêta : l'intelligence de l'abandon

L'algorithme minimax brut est d'une inefficacité spectaculaire. Pour une profondeur de recherche de $d$ coups et un facteur de branchement de $b$ (nombre moyen de coups légaux), il faut évaluer $b^d$ positions. À $b = 35$ et $d = 10$ , c'est $35^{10} \approx 2{,}8 \times 10^{15}$ positions. Impossible en pratique.

L'élagage alpha-bêta, développé indépendamment par plusieurs chercheurs dans les années 1950-1960 et formalisé par John McCarthy, résout ce problème en élaguant les branches qui ne peuvent pas influencer la décision finale.

Le principe est le suivant : si tu as déjà trouvé une option pour Blanc qui garantit un résultat de valeur $\alpha$ , et que tu explores une branche où Noir peut forcer un résultat inférieur à $\alpha$ pour Blanc, cette branche peut être abandonnée. Blanc ne la choisira jamais, car il a déjà mieux.

Formellement, tu maintiens deux bornes (dans le pseudo-code ou sur le tableau) :

$\alpha$ : la meilleure valeur déjà garantie pour le joueur maximisant (Blanc)
$\beta$ : la meilleure valeur déjà garantie pour le joueur minimisant (Noir)

Quand $\alpha \geq \beta$ , la branche courante est élagée : elle ne peut pas produire un résultat meilleur que ce qui est déjà connu.

Dans le cas optimal (si les coups sont ordonnés par ordre de qualité décroissante), alpha-bêta réduit le nombre de noeuds de $b^d$ à $b^{d/2}$ , doublant effectivement la profondeur de recherche possible pour un même budget de calcul.

Negamax : la simplification qui change le code

En pratique, presque aucun moteur n'implémente minimax dans sa forme à deux branches (max pour Blanc, min pour Noir). Tous utilisent la formulation negamax, qui exploite l'identité $\min(a,b) = -\max(-a,-b)$ dans un jeu à somme nulle. Le code passe de deux fonctions distinctes à une seule, avec un retournement de signe à chaque appel récursif. Conceptuellement identique, mais beaucoup plus court (15 lignes de code contre 40) et facile à maintenir. Quand un développeur dit "j'implémente minimax", il veut presque toujours dire "j'implémente negamax avec alpha-bêta".

Null-move pruning : faire passer son tour pour gagner du temps

Une heuristique puissante : et si tu passes ton tour ? Si la position reste bonne pour toi malgré ce coup gratuit donné à l'adversaire, alors elle est probablement très bonne pour toi, et tu peux élaguer profondément le reste de l'analyse. C'est le null-move pruning, technique standard depuis les années 1990. Aux échecs, l'astuce a une limite connue (le zugzwang: situation où tout coup empire la position, typique des finales de pions), donc les moteurs désactivent l'heuristique en finale ou dans les positions identifiées comme zugzwang potentiel. Gain typique : encore un facteur 2 à 4 sur la vitesse effective.

Les techniques avancées des moteurs modernes

Les moteurs d'échecs modernes comme Stockfish ajoutent de nombreuses techniques au-dessus d'alpha-bêta de base :

Tables de transposition : un cache de positions déjà analysées. Si la même position est atteinte par des ordres de coups différents (transposition), le moteur réutilise l'analyse précédente au lieu de la recalculer. Les tables de transposition peuvent économiser des ordres de grandeur en temps de calcul.

Approfondissement itératif : au lieu d'effectuer directement une recherche à profondeur $d$ , le moteur enchaîne des recherches successives à profondeur 1, 2, 3, ..., $d$ . Chaque itération fournit un meilleur ordonnancement des coups pour l'itération suivante, améliorant l'efficacité de l'élagage.

Recherche de quiescence : à la profondeur maximale, au lieu d'évaluer statiquement, la recherche se prolonge jusqu'à une position "quiescente" (stable), en n'explorant que les captures et promotions. Cela évite d'évaluer des positions où un échange de pièces non résolu fausserait l'évaluation.

Extensions de recherche : dans certaines positions (mat en vue, pion passé avancé, position critique), la profondeur de recherche est automatiquement étendue au-delà de la limite nominale pour éviter l'effet d'horizon.

Réductions de recherche (LMR) : inversement, pour les coups peu prometteurs (late move reduction), la profondeur est réduite pour économiser du temps. Si ces coups s'avèrent meilleurs que prévu, la profondeur est restaurée.

L'histoire des moteurs minimax : de Claude Shannon à Stockfish

L'histoire des moteurs d'échecs est l'histoire des améliorations successives de minimax.

En 1950, Claude Shannon a posé les bases théoriques dans son article "Programming a Computer for Playing Chess", identifiant les deux approches (force brute vs. sélection heuristique) et les défis fondamentaux.

En 1957, Alex Bernstein a créé le premier programme d'échecs fonctionnel sur IBM 704, utilisant une version simplifiée de minimax avec une évaluation rudimentaire.

Les années 1970-1980 ont vu l'essor des puces dédiées aux échecs. Belle de Ken Thompson et Joe Condon fut le premier programme à atteindre le niveau maître. Deep Thought d'Hsu et Campbell atteignit le niveau Grand Maître.

L'apogée du minimax classique fut Deep Blue, qui battit Kasparov en 1997. Deep Blue évaluait 200 millions de positions par seconde avec une fonction d'évaluation développée en collaboration avec des Grand Maîtres.

Stockfish, développé depuis 2008, représente l'aboutissement de l'approche minimax classique avec une évaluation manuelle. Depuis 2020, il intègre NNUE (Efficiently Updatable Neural Network), un réseau de neurones intégré à la fonction d'évaluation.

AlphaZero et le dépassement de minimax

En 2017, DeepMind a publié les résultats d'AlphaZero, un programme qui a appris à jouer aux échecs par auto-jeu en quelques heures et battu Stockfish de façon convaincante.

AlphaZero n'utilise pas minimax classique mais une Monte Carlo Tree Search (MCTS) guidée par un réseau de neurones profond. Au lieu d'explorer exhaustivement l'arbre avec élagage, MCTS explore stochastiquement les branches les plus prometteuses selon une politique apprise.

Ce qui a frappé la communauté des échecs n'est pas seulement la performance d'AlphaZero, mais son style de jeu. AlphaZero joue de façon audacieuse et créative, avec des sacrifices de matériel à long terme et une préférence pour l'activité des pièces sur les avantages matériels immédiats. Ce style ressemble plus à un joueur humain intuitif qu'à un moteur de force brute.

AlphaZero a montré que minimax n'est pas la seule voie vers la maîtrise des échecs. L'apprentissage par renforcement peut produire une compréhension différente et parfois plus profonde du jeu. (Le match AlphaZero-Stockfish de 2017 reste l'épisode fondateur de cette révolution. Pour le mur combinatoire qui rend ces approches nécessaires, voir pourquoi les échecs sont un problème presque impossible ; pour les zones où ces algorithmes sont les plus stressés, la théorie du chaos aux échecs.)

Minimax dans ta tête

L'aspect le plus fascinant de minimax pour le joueur pratique est qu'il décrit ce que tu fais déjà quand tu calcules des variantes. Quand tu penses "si je joue là, il peut répondre ça ou ça. S'il répond ça, je joue ceci et il est forcé de...", tu exécutes mentalement un algorithme minimax tronqué.

Tes limites humaines déterminent la "profondeur" de ta recherche. Un joueur à 1200 explore peut-être 2-3 niveaux de façon fiable. Un Grand Maître explore 7-10 niveaux dans des positions stratégiques et davantage dans les positions tactiques forcées.

La différence entre un joueur moyen et un Grand Maître n'est pas seulement la profondeur : c'est aussi la qualité de la fonction d'évaluation interne (l'intuition positionnelle) et l'efficacité de l'élagage (la capacité à identifier rapidement les coups pertinents et à ignorer les mauvais sans les calculer).

Entraîner ces deux aspects est au coeur du développement d'un joueur : enrichir son sens positionnel pour améliorer son évaluation, et affiner son instinct des "coups candidats" pour améliorer son élagage. Minimax est la description formelle de ce processus.

Après lecture : sur un problème tactique, impose une profondeur fixe (ex. trois demi-coups) avant de regarder la solution : tu calibres ton minimax interne.

Minimax aux échecs : l'algorithme qui pense à ta place