Il mito dei numeri caldi e freddi
Le classifiche dei numeri caldi e freddi sono il fraintendimento più persistente della statistica della lotteria. Da dove viene l'idea, perché sembra convincente e cosa dicono davvero i dati.
Se chiedi alla maggior parte dei giocatori della lotteria se i numeri possano essere "caldi" o "freddi", un numero sorprendente risponderà di sì. Alcuni ti diranno con sicurezza quali numeri considerano caldi nel loro gioco locale. Qualcuno dirà di puntare sui numeri caldi; qualcun altro su quelli freddi. I due gruppi spesso fanno riferimento agli stessi dati.
Questo è uno dei casi più lampanti in cui, nella probabilità, intuizione e realtà tirano in direzioni opposte. L'impostazione caldo/freddo è così naturale da sembrare buon senso. Ed è anche sbagliata. Questo articolo spiega perché, e perché è così difficile abbandonarla.
Cosa significano caldo e freddo
Nella maggior parte dei contesti della lotteria, i numeri "caldi" sono quelli che sono apparsi nelle estrazioni più spesso della media in una recente finestra di frequenze dei numeri. I numeri "freddi" sono quelli che sono apparsi meno spesso della media. La finestra può essere composta dalle ultime 20 estrazioni, dalle ultime 100 o dall'ultimo anno: le definizioni variano, e questa variazione è parte del problema.
Da questa impostazione di base nascono due consigli opposti:
- Gioca i numeri caldi: stanno andando bene, cavalca l'onda.
- Gioca i numeri freddi: sono in ritardo, il loro turno sta arrivando.
Entrambi i gruppi guardano gli stessi dati e traggono conclusioni opposte. Quando questo succede in statistica, di solito è il segno che è il quadro stesso a essere rotto.
La risposta statistica
Per estrazioni della lotteria realmente casuali — cioè in sostanza tutte le principali lotterie moderne — la frequenza passata non ha alcun effetto sulla frequenza futura. Le palline non ricordano quali sono state estratte di recente. La macchina non tiene traccia della storia. Ogni estrazione è un nuovo evento casuale con le stesse probabilità sottostanti.
Non è un'affermazione teorica: è una proprietà che i regolatori verificano attivamente. Le lotterie eseguono test statistici estesi sulle loro macchine di estrazione proprio per verificare che le estrazioni siano indipendenti. Se non lo fossero, le macchine non otterrebbero la certificazione e non verrebbero utilizzate.
Quando un numero appare più del previsto in una finestra recente, ci sono solo tre possibilità:
- Varianza casuale. L'esito atteso di un processo casuale su un campione finito non è mai perfettamente uniforme. Alcuni numeri saranno al di sopra della media per puro caso. In una finestra di 20 estrazioni questa varianza è marcata: un numero può apparire 3–4 volte o non apparire affatto, interamente per caso.
- Errori di misura. Errori di inserimento dei dati, attribuzioni errate delle estrazioni o bug nella logica del grafico. Rari, ma vale la pena escluderli.
- Bias effettivo nell'estrazione. La macchina presenta un difetto sottile che favorisce certi numeri. Per le lotterie affidabili questo è estremamente raro: quando è accaduto nella storia, è stato individuato e la lotteria è stata sospesa.
L'opzione 1 spiega in pratica tutti gli schemi caldo/freddo che le persone vedono. Le opzioni 2 e 3 sono casi eccezionali.
Perché sembra convincente
Se la matematica è così chiara, perché l'impostazione caldo/freddo persiste? Perché l'intuizione umana è debole in diverse operazioni specifiche richieste dalla statistica della lotteria.
Cerchiamo pattern in modo aggressivo. Il nostro cervello è sintonizzato per trovare pattern, anche dove non ne esistono. Vedere un numero uscire tre volte in cinque estrazioni viene registrato come schema, anche se quell'esito è perfettamente coerente con la casualità.
Sottostimiamo i raggruppamenti casuali. Le sequenze realmente casuali appaiono molto più "a grumi" di quanto la gente si aspetti. Se chiedi alle persone di scrivere una sequenza "casuale" di lanci di moneta, tenderanno a distribuire teste e croci in modo troppo uniforme: la vera casualità ha serie, e le serie sembrano non casuali.
Ricordiamo i colpi andati a segno, non gli errori. Se il mese scorso hai giocato i numeri caldi e due sono usciti, rimane impresso. I tre mesi in cui non sono usciti sono meno memorabili. Si chiama bias di conferma, e la statistica della lotteria ne è l'ambiente perfetto.
Diamo troppa fiducia ai campioni piccoli. "È uscito tre volte nelle ultime venti estrazioni" sembra un'evidenza forte. Non lo è. La varianza di una distribuzione binomiale è ampia su campioni così piccoli. Intuitivamente il campione sembra grande; statisticamente è poco informativo.
Un esempio concreto
Ecco un modo pratico per vedere la varianza. Immagina una lotteria 6/49 e considera solo le ultime 20 estrazioni. Ogni estrazione seleziona 6 numeri su 49, quindi un singolo numero ha una probabilità di 6/49 ≈ 12,2% di apparire in una data estrazione.
Su 20 estrazioni, ci si aspetta che ogni numero appaia in media circa 2,4 volte. Ma poiché si tratta di un processo casuale, il conteggio effettivo varia. Per uno specifico numero, la probabilità che appaia:
- 0 volte: circa 7,5%
- 1 volta: circa 21%
- 2 volte: circa 27%
- 3 volte: circa 22%
- 4 volte: circa 13%
- 5 o più volte: circa 9%
In una qualsiasi finestra di 20 estrazioni avrai circa 49 numeri distribuiti su questi esiti. In media, 4 o 5 appariranno almeno 4 volte e 3 o 4 non appariranno affatto. Se selezioni quelli comparsi di più e li definisci "caldi", ne troverai sempre qualcuno: la matematica lo garantisce.
Sposta la finestra in avanti di dieci estrazioni. I numeri caldi quasi certamente non saranno gli stessi. Non erano caldi: stavano solo dal lato fortunato della varianza, e la varianza non persiste.
L'idea del "in ritardo" è altrettanto sbagliata
L'argomento speculare — che i numeri freddi siano in ritardo — si chiama fallacia del giocatore ed è altrettanto errato. Un numero che non esce da 50 estrazioni non è in ritardo. Ha esattamente la stessa probabilità di uscire alla prossima estrazione che aveva 50 estrazioni fa, che è esattamente la stessa probabilità di ogni altro numero. La macchina non ha alcun obbligo di "compensare".
La fallacia è intuitiva perché pensiamo ai processi casuali come autocorrettivi. Non lo sono. Sono senza memoria. Su estrazioni infinite le frequenze convergono verso l'uniforme, ma solo nel senso che la varianza naturale si riduce in rapporto al conteggio totale, non perché una qualche forza riporti i singoli conteggi verso la media.
Com'è fatto il dato senza il mito
Se togli l'impostazione caldo/freddo e guardi i dati reali della lotteria, ecco cosa vedi:
- I numeri oscillano attorno ai loro valori attesi, con la quantità prevista di varianza.
- Su finestre lunghe, le frequenze si avvicinano sempre di più all'uniforme.
- Su finestre brevi, si ottengono oscillazioni apparentemente spettacolari ma perfettamente coerenti con la casualità.
- I numeri "caldi" di una finestra quasi mai sono anche i "caldi" della successiva.
Non è un esito noioso: è in realtà la firma di un processo casuale ben progettato. Se i numeri caldi persistessero, ciò sarebbe indizio di una macchina difettosa.
Come verificarlo da soli
Se hai accesso ai dati storici di una lotteria, puoi fare un controllo semplice in meno di un'ora. Prendi i numeri più frequentemente estratti in una certa finestra (ad esempio i primi 10 nelle ultime 50 estrazioni). Ora guarda le successive 50 estrazioni e vedi come si sono comportati quei numeri "caldi".
Se l'impostazione caldo/freddo fosse reale, continuerebbero a superare le aspettative. Quello che vedrai, invece, è che rientrano nei valori attesi: a volte un po' sopra, a volte un po' sotto, tutto entro le normali bande di varianza.
Questo test è uno dei modi più chiari per costruire intuito sulla casualità. E si generalizza: quasi ogni pretesa di pattern predittivo in dati casuali fallisce lo stesso test.
Cosa facciamo con i dati di frequenza
Su LottoWise pubblichiamo grafici di frequenza per ogni lotteria che seguiamo perché riteniamo che il dato sia davvero interessante: è una finestra sul comportamento dei processi casuali, e l'intuito della maggior parte delle persone su quel comportamento è sbagliato. Quello che non facciamo è classificare i numeri come scelte "calde" o "fredde". Non raccomandiamo numeri da giocare, perché non esiste un modo onesto di farlo.
Se vedi una piattaforma di analisi della lotteria che propone una lista di "top picks" derivata dai dati di frequenza, o sta fraintendendo la matematica o sta vendendo a un pubblico a cui la matematica non interessa. In ogni caso il risultato è lo stesso: le selezioni non sono migliori di una scelta casuale.
In sintesi
I numeri caldi e freddi sono un mito, anche se comprensibile. I processi casuali producono pattern che sembrano significativi, e l'intuito umano non è attrezzato per vederli per quello che sono.
I dati restano utili: per capire la probabilità, per osservare la varianza naturale, per smontare la superstizione su cosa significhi davvero "casuale". Non sono però utili per scegliere i numeri. Niente lo è, perché le estrazioni non hanno memoria.
Se ti piace giocare alla lotteria, giocaci. Se ti piace la statistica, studiala. Basta non confondere le due attività, e non farti pagare da nessuno per una lista di "numeri caldi" che vale — matematicamente, senza ambiguità — zero.