Capire le frequenze dei numeri della lotteria
I grafici di frequenza sono uno degli strumenti più consultati nell'analisi della lotteria, e uno dei più fraintesi. Una guida pratica a cosa fanno, cosa non fanno e cosa non possono dirti.
Apri qualsiasi sito di analisi della lotteria e una delle prime cose che vedrai è un grafico di frequenza. Di solito è un grafico a barre con un numero su un asse e un'altezza che riflette quante volte quel numero è stato estratto. A volte c'è una codifica a colori — numeri caldi in rosso, numeri freddi in blu.
I grafici di frequenza sono popolari perché sono immediatamente leggibili. Li guardi e hai la sensazione di aver imparato qualcosa. Spesso è vero. Altrettanto spesso, hai imparato la cosa sbagliata. Questo articolo spiega come leggerli correttamente.
Cosa misura davvero un grafico di frequenza
Un grafico di frequenza della lotteria risponde a una domanda specifica: su una certa finestra di estrazioni, quante volte è apparso ciascun numero?
Tutto qui. Non "quali numeri sono fortunati". Non "quali numeri sono in ritardo". Non "quali numeri giocare dopo". Solo un conteggio grezzo, su una finestra definita, per una specifica lotteria.
Sembra ovvio, ma la distinzione conta perché quasi ogni confusione sui grafici di frequenza nasce dal trattare quel conteggio come qualcosa di più di un conteggio.
Le tre variabili che devi conoscere
Prima di poter leggere onestamente un grafico di frequenza, ti servono tre informazioni. Se il grafico non le mostra, sii sospettoso.
La lotteria. Le frequenze hanno senso solo all'interno di una singola lotteria. Powerball (5/69 + 1/26) ed EuroMillions (5/50 + 2/12) hanno spazi campionari completamente diversi; non puoi confrontare direttamente i loro grafici di frequenza.
La finestra. Quante estrazioni copre il grafico? Le ultime 20? Le ultime 500? Gli ultimi cinque anni? Un grafico su 20 estrazioni ti mostra rumore di breve periodo. Un grafico su 5.000 estrazioni ti mostra qualcosa di vicino alla distribuzione sottostante. Sono cose diverse. Una piattaforma che non dichiara la propria finestra sta nascondendo la variabile più importante.
La baseline. Come sarebbero le frequenze se la lotteria fosse perfettamente uniforme? Per un 6/49 su 500 estrazioni, ogni numero dovrebbe apparire all'incirca 500 × 6/49 ≈ 61 volte. Ogni grafico dovrebbe mostrare quella baseline come linea di riferimento o banda ombreggiata. Senza di essa la varianza naturale appare drammatica; rispetto ad essa di solito sembra rumore.
Se vedi un grafico di frequenza senza queste tre informazioni, chiudilo. È decorazione, non informazione — la nostra guida per leggere i grafici di frequenza senza illudersi spiega per intero la disciplina.
Cosa significano davvero "caldo" e "freddo"
Il modo più comune di fraintendere i grafici di frequenza è l'impostazione caldo/freddo. I numeri sopra la baseline sono "caldi"; quelli sotto sono "freddi". Alcune piattaforme estrapolano da lì dei consigli — gioca i numeri caldi perché stanno andando bene, o gioca quelli freddi perché sono "in ritardo".
Entrambe le estrapolazioni sono sbagliate, e per la stessa ragione: la varianza che stai vedendo è quasi sicuramente rumore.
Considera una lotteria 6/49 dove la frequenza attesa di ogni numero su 500 estrazioni è 61. La teoria statistica dice che il conteggio effettivo per un dato numero cadrà in un intervallo attorno a 61, con ampiezza determinata dalla deviazione standard di una distribuzione binomiale. In questo caso la deviazione standard è circa 7,4. Questo significa che all'incirca il 95% dei numeri avrà conteggi tra 46 e 76 — puramente per variazione casuale.
Se vedi un numero con conteggio 73, non è "in serie calda". È ben dentro l'intervallo normale della varianza casuale. Lo stesso vale per un numero con conteggio 49 — non è "freddo", è solo leggermente sotto il valore atteso, entro la normale variazione statistica.
Il modo tecnico di dirlo è: frequenze osservate che cadono entro due deviazioni standard dal valore atteso non forniscono evidenza di non-uniformità. La maggior parte dei pattern caldo/freddo che le persone vedono sono esattamente così.
Quando un grafico di frequenza direbbe qualcosa di reale?
C'è un insieme ristretto di casi in cui i dati di frequenza potrebbero indicare un effetto reale:
Finestre molto lunghe. Su 5.000 o 10.000 estrazioni, la varianza naturale si restringe rispetto al valore atteso e un eventuale bias reale inizierebbe a emergere. Per la maggior parte delle lotterie ciò significa decenni di dati, e la maggior parte delle lotterie è stata auditata rigorosamente su quei periodi. La risposta è quasi sempre: nessun bias reale.
Outlier estremi. Se il conteggio di un numero cade oltre cinque o sei deviazioni standard dall'atteso, vale la pena indagare. Non accade quasi mai nelle lotterie affidabili. Se accade, il primo sospetto è un errore di raccolta dati, non la fisica della lotteria.
Confronti tra lotterie con metodologia coerente. È più accademico che operativo, ma è possibile studiare molte lotterie e cercare eventuali deviazioni sistematiche. Studi peer-reviewed sulle principali lotterie hanno in genere trovato quanto ci si aspetta: le estrazioni sono statisticamente indistinguibili dal caso.
Una guida pratica alla lettura
Con tutto questo in mente, ecco come usare davvero un grafico di frequenza senza illuderti:
- Verifica le tre variabili. Lotteria, finestra, baseline. Se manca una, fermati.
- Guarda la dispersione, non gli estremi. La domanda interessante non è "quale numero è il più alto?" — è "quanta dispersione c'è in totale?". Confrontala con la dispersione attesa per una distribuzione uniforme.
- Assumi la varianza come rumore per default. L'onere della prova è sulla deviazione, non sull'uniformità. Se non puoi spiegare una deviazione con diverse deviazioni standard di dati, è rumore.
- Guarda più finestre. I numeri che sono "caldi" in una finestra raramente lo sono nella successiva. Se la "calzza" non persiste, non era reale.
- Non scegliere numeri da esso. È la linea chiara. I grafici di frequenza descrivono cosa è successo. Non prevedono cosa succederà.
Cosa fanno le piattaforme di analisi oneste
Una piattaforma che prende sul serio i dati di frequenza:
- Mostra esplicitamente la baseline. Di solito come banda ombreggiata per una e due deviazioni standard.
- Ti permette di cambiare la finestra. Finestre diverse rispondono a domande diverse. Una piattaforma che lo nasconde sta semplificando troppo.
- Si rifiuta di classificare i numeri come "top picks". Nessuna piattaforma onesta classifica i numeri per probabilità di vittoria implicita, perché non esiste una probabilità di vittoria implicita.
- Spiega la matematica. Dovresti poter trovare una pagina che ti dica come hanno calcolato la baseline e perché le bande di varianza sono quelle che sono.
I grafici di frequenza come didattica della probabilità
Usato correttamente, un grafico di frequenza è un meraviglioso strumento didattico. Mostra la varianza naturale di un processo casuale in modo immediatamente visibile, e quasi mai corrisponde all'intuizione delle persone. La maggior parte si aspetta che le distribuzioni uniformi appaiano uniformi; non lo sono. Sembrano "a grumi". Imparare a vedere i grumi come attesi, piuttosto che come segnale, è l'inizio dell'alfabetizzazione probabilistica.
Questa è la cosa migliore che i grafici di frequenza possono fare: non scegliere numeri, ma allenare il tuo intuito su come appare davvero la casualità.
In sintesi
Un grafico di frequenza della lotteria è un conteggio su una finestra, confrontato con una baseline attesa. È utile per capire quanto rumorose siano davvero le estrazioni casuali, e per tagliare via l'intuizione che piccole varianze significhino qualcosa.
Non è utile per scegliere i numeri. Non può esserlo. Le estrazioni che hanno prodotto il grafico erano indipendenti l'una dall'altra, il che significa che il grafico non ha alcun potere predittivo sulla prossima estrazione. Non è un limite del grafico — è una proprietà del processo sottostante.
Se ti piace guardare i dati di frequenza, provalo tu stesso e guardalo per ciò che è: una finestra su un processo casuale. Nel momento in cui inizi a sceglierne i numeri, il grafico smette di essere analisi e diventa superstizione con un grafico attaccato.