Analytique8 min de lecture

Le mythe des numéros chauds et froids

Le classement des numéros chauds et froids est la confusion la plus tenace des statistiques de loterie. D'où vient l'idée, pourquoi elle paraît convaincante, et ce que disent réellement les données.

Équipe LottoWise

Si vous demandez à la plupart des joueurs de loterie si les numéros peuvent être « chauds » ou « froids », un nombre surprenant répondra oui. Certains vous diront avec assurance quels numéros ils considèrent chauds dans leur jeu local. Quelques-uns diront qu'ils jouent les numéros chauds ; d'autres diront qu'ils jouent les numéros froids. Les deux groupes citent souvent les mêmes données.

C'est l'un des cas les plus clairs en probabilités où l'intuition et la réalité tirent dans des directions opposées. Le cadre chaud/froid est si naturel qu'il semble relever du bon sens. Il est pourtant faux. Cet article explique pourquoi — et pourquoi il est si difficile d'y renoncer.

Ce que signifient chaud et froid

Dans la plupart des contextes de loterie, les numéros « chauds » sont ceux qui sont apparus dans les tirages plus souvent que la moyenne sur une fenêtre récente de fréquences des numéros de loterie. Les numéros « froids » sont ceux qui sont apparus moins souvent que la moyenne. La fenêtre peut être les 20 derniers tirages, les 100 derniers ou la dernière année — les définitions varient, et cette variation fait partie du problème.

À partir de ce cadre de base, deux conseils opposés émergent :

  • Jouer les numéros chauds : ils ont le vent en poupe, il faut suivre la dynamique.
  • Jouer les numéros froids : ils sont en retard, leur tour approche.

Les deux groupes regardent les mêmes données et tirent des conclusions opposées. Quand cela arrive en statistiques, c'est généralement le signe que le cadre lui-même est défectueux.

La réponse statistique

Pour les tirages de loterie véritablement aléatoires — ce qui est le cas de presque toutes les grandes loteries modernes — la fréquence passée n'a aucun effet sur la fréquence future. Les boules ne se souviennent pas lesquelles ont été tirées récemment. La machine ne suit pas l'historique. Chaque tirage est un nouvel événement aléatoire avec les mêmes probabilités sous-jacentes.

Ce n'est pas une affirmation théorique ; c'est une propriété que les régulateurs testent activement. Les loteries réalisent des tests statistiques étendus sur leurs machines de tirage précisément pour vérifier que les tirages sont indépendants. S'ils ne l'étaient pas, les machines échoueraient à la certification et ne seraient pas utilisées.

Lorsqu'un numéro apparaît plus souvent qu'attendu dans une fenêtre récente, il n'y a que trois possibilités :

  1. Variance aléatoire. Le résultat attendu d'un processus aléatoire sur un échantillon fini n'est jamais parfaitement uniforme. Certains numéros seront au-dessus de la moyenne par pur hasard. Sur une fenêtre de 20 tirages, cette variance est spectaculaire — les numéros peuvent apparaître 3 à 4 fois ou pas du tout, entièrement par hasard.
  2. Erreur de mesure. Erreurs de saisie des données, attribution incorrecte d'un tirage, ou bogues dans la logique du graphique. Rare, mais à exclure.
  3. Biais réel dans le tirage. La machine présente un défaut subtil qui favorise certains numéros. Pour les loteries réputées, c'est extrêmement rare — lorsque cela s'est produit historiquement, cela a été détecté et la loterie a été suspendue.

L'option 1 explique pratiquement tous les schémas chaud/froid que les gens observent. Les options 2 et 3 sont exceptionnelles.

Pourquoi cela paraît convaincant

Si les mathématiques sont si claires, pourquoi le cadre chaud/froid persiste-t-il ? Parce que l'intuition humaine est mauvaise sur plusieurs points précis que les statistiques de loterie exigent.

Nous reconnaissons les schémas de manière agressive. Notre cerveau est réglé pour trouver des schémas, même là où il n'y en a pas. Voir un numéro sortir trois fois en cinq tirages s'enregistre comme un schéma, alors même que ce résultat est entièrement cohérent avec le hasard.

Nous sous-estimons le regroupement aléatoire. Les séquences véritablement aléatoires paraissent bien plus agglomérées que les gens ne s'y attendent. Si vous demandez aux gens d'écrire une séquence « aléatoire » de pile ou face, ils répartiront pile et face de manière trop équilibrée — le vrai hasard contient des séries, et ces séries semblent non aléatoires.

Nous retenons les succès, pas les échecs. Si vous avez joué les numéros chauds le mois dernier et que deux d'entre eux sont sortis, cela reste gravé. Les trois mois où ils ne sont pas sortis sont moins mémorables. C'est ce qu'on appelle le biais de confirmation, et les statistiques de loterie en sont un exemple d'école.

Nous faisons trop confiance aux petits échantillons. « Il est sorti trois fois sur les vingt derniers tirages » semble une preuve solide. Ce n'en est pas une. La variance d'une distribution binomiale est large à des tailles d'échantillon aussi petites. Intuitivement, l'échantillon paraît grand ; statistiquement, il est à peine informatif.

Un exemple travaillé

Voici une manière concrète de visualiser la variance. Imaginez une loterie 6/49, et considérez uniquement les 20 derniers tirages. Chaque tirage choisit 6 numéros parmi 49, donc tout numéro individuel a une chance de 6/49 ≈ 12,2 % d'apparaître à un tirage donné.

Sur 20 tirages, chaque numéro devrait apparaître environ 2,4 fois en moyenne. Mais comme c'est un processus aléatoire, le compte réel varie. Pour un numéro donné, la probabilité qu'il apparaisse :

  • 0 fois : environ 7,5 %
  • 1 fois : environ 21 %
  • 2 fois : environ 27 %
  • 3 fois : environ 22 %
  • 4 fois : environ 13 %
  • 5 fois ou plus : environ 9 %

Sur toute fenêtre de 20 tirages, vous aurez à peu près 49 numéros répartis entre ces résultats. En moyenne, 4 ou 5 d'entre eux apparaîtront 4 fois ou plus, et 3 ou 4 n'apparaîtront pas du tout. Si vous isolez ceux qui sont apparus le plus souvent et que vous les appelez « chauds », vous en trouverez toujours — les mathématiques le garantissent.

Avancez la fenêtre de dix tirages. Les numéros chauds ne seront presque certainement pas les mêmes. Ils n'étaient pas chauds ; ils étaient simplement du bon côté de la variance, et la variance ne persiste pas.

Le cadre « en retard » est tout aussi défectueux

L'argument miroir — selon lequel les numéros froids seraient dus — s'appelle la sophisme du joueur, et il est tout aussi erroné. Un numéro qui n'est pas sorti depuis 50 tirages n'est pas « dû ». Il a exactement la même probabilité de sortir au tirage suivant qu'il y a 50 tirages, qui est exactement la même probabilité que tous les autres numéros. La machine n'a aucune obligation de « rétablir l'équilibre ».

Le sophisme est intuitif parce que nous imaginons les processus aléatoires comme s'auto-corrigeant. Ils ne le sont pas. Ils sont sans mémoire. Sur une infinité de tirages, les fréquences convergent bien vers l'uniforme, mais seulement parce que la variance naturelle se réduit relativement au total — et non parce qu'une force ramènerait les comptes individuels vers la moyenne.

À quoi ressemblent les données sans le mythe

Si l'on retire le cadre chaud/froid et que l'on regarde les vraies données de loterie, voici ce que l'on voit :

  • Les numéros fluctuent autour de leurs valeurs attendues, avec la quantité de variance attendue.
  • Sur les longues fenêtres, les fréquences se rapprochent de plus en plus de l'uniforme.
  • Sur les fenêtres courtes, on obtient des écarts d'apparence spectaculaire qui sont entièrement cohérents avec le hasard.
  • Les numéros « chauds » d'une fenêtre sont presque jamais les numéros « chauds » de la suivante.

Ce n'est pas un résultat ennuyeux — c'est la signature d'un processus aléatoire bien conçu. Si les numéros chauds persistaient, ce serait la preuve d'une machine défectueuse.

Comment vérifier par vous-même

Si vous avez accès aux données historiques d'une loterie, vous pouvez effectuer un test simple en moins d'une heure. Prenez les numéros les plus fréquemment tirés sur une fenêtre donnée (par exemple, le top 10 sur les 50 derniers tirages). Puis regardez les 50 tirages suivants et voyez comment ces numéros « chauds » ont performé.

Si le cadre chaud/froid était réel, ils continueraient à surperformer. Ce que vous verrez à la place, c'est qu'ils reviennent à la moyenne — parfois un peu au-dessus, parfois un peu en dessous, le tout dans les bandes de variance normales.

Ce test est l'un des moyens les plus clairs de développer son intuition du hasard. Il se généralise aussi : presque toute affirmation de schémas prédictifs dans des données aléatoires échoue à ce même test.

Ce que nous faisons avec les données de fréquence

Chez LottoWise, nous publions des graphiques de fréquence pour chaque loterie que nous suivons parce que nous pensons que ces données sont véritablement intéressantes — c'est une fenêtre sur le comportement des processus aléatoires, et la plupart des intuitions sur ce comportement sont erronées. Ce que nous ne faisons pas, c'est classer les numéros comme des choix « chauds » ou « froids ». Nous ne recommandons pas de numéros à jouer, parce qu'il n'y a pas de manière honnête de le faire.

Si vous voyez une plateforme d'analyse de loterie qui propose une liste de « meilleurs choix » issue des données de fréquence, soit elle comprend mal les mathématiques, soit elle s'adresse à un public qui ne se soucie pas que les mathématiques soient justes. Dans les deux cas, le résultat est le même : les choix ne valent pas mieux que le hasard.

En résumé

Les numéros chauds et froids sont un mythe, mais un mythe compréhensible. Les processus aléatoires produisent des schémas qui semblent porteurs de sens, et l'intuition humaine n'est pas équipée pour les voir tels qu'ils sont.

Les données restent utiles — pour comprendre les probabilités, pour observer la variance naturelle, pour dissiper la superstition sur ce que signifie « aléatoire ». Elles ne sont simplement pas utiles pour choisir des numéros. Rien ne l'est, parce que les tirages n'ont pas de mémoire.

Si jouer à la loterie vous plaît, jouez. Si les statistiques vous plaisent, étudiez-les. Mais ne confondez pas les deux activités, et ne laissez personne vous facturer une liste de « numéros chauds » qui ne vaut — mathématiquement, sans ambiguïté — rien.