Entendendo as Frequências de Números de Loteria
Os gráficos de frequência são uma das ferramentas mais vistas em análise de loteria, e uma das mais mal interpretadas. Um guia prático sobre o que eles dizem, o que não dizem e o que não podem dizer.
Abra qualquer site de análise de loteria e uma das primeiras coisas que você verá é um gráfico de frequência. Em geral é um gráfico de barras com um número em cada eixo e uma altura que indica quantas vezes aquele número foi sorteado. Às vezes há um código de cores — quentes em vermelho, frios em azul.
Gráficos de frequência são populares porque são imediatamente legíveis. Você olha e sente que aprendeu algo. Muitas vezes aprendeu. Quase com a mesma frequência, aprendeu a coisa errada. Este artigo é sobre como lê-los direito.
O que um gráfico de frequência realmente mede
Um gráfico de frequência de loteria responde a uma pergunta específica: em alguma janela de sorteios, com que frequência cada número apareceu?
Só isso. Não "quais números são sorteados" de forma privilegiada. Não "quais estão devidos". Não "em quais apostar em seguida". Apenas a contagem bruta, em uma janela definida, para uma loteria específica.
Parece óbvio, mas a distinção importa porque quase toda confusão em torno de gráficos de frequência vem de tratar essa contagem como algo além de uma contagem.
As três variáveis que você precisa conhecer
Antes de ler um gráfico de frequência honestamente, você precisa de três informações. Se o gráfico não as mostra, desconfie.
A loteria. Frequências só significam algo dentro de uma mesma loteria. Powerball (5/69 + 1/26) e EuroMillions (5/50 + 2/12) têm espaços amostrais completamente diferentes; não dá para comparar seus gráficos diretamente.
A janela. Quantos sorteios o gráfico cobre? Os últimos 20? Os últimos 500? Os últimos cinco anos? Um gráfico em 20 sorteios mostra ruído de curto prazo. Um gráfico em 5.000 sorteios mostra algo próximo da distribuição subjacente. São coisas diferentes. Uma plataforma que não divulga a janela está escondendo a variável mais importante.
A linha de base. Como seriam as frequências se a loteria fosse perfeitamente uniforme? Em uma 6/49 ao longo de 500 sorteios, cada número deveria aparecer cerca de 500 × 6/49 ≈ 61 vezes. Todo gráfico deveria mostrar essa base como linha de referência ou faixa sombreada. Sem ela, a variância natural parece dramática; com ela, costuma parecer ruído.
Se vir um gráfico de frequência sem esses três, feche. É decoração, não informação — nosso guia sobre como ler gráficos de frequência sem se enganar detalha toda a disciplina.
O que "quente" e "frio" realmente significam
O uso mais comum e equivocado dos gráficos de frequência é a narrativa de quente/frio. Números acima da linha de base são "quentes"; abaixo, "frios". Algumas plataformas extrapolam para conselhos — aposte nos quentes porque estão "indo bem", ou nos frios porque estão "devidos".
As duas extrapolações estão erradas, pelo mesmo motivo: a variância que você está vendo é quase certamente ruído.
Considere uma loteria 6/49 em que a frequência esperada de cada número em 500 sorteios é 61. A teoria estatística diz que a contagem real de qualquer número cairá em uma faixa em torno de 61, com a largura determinada pelo desvio-padrão de uma distribuição binomial. Neste caso, o desvio-padrão é cerca de 7,4. Isso significa que aproximadamente 95% dos números terão contagens entre 46 e 76 — apenas por variação aleatória.
Se você vê um número com contagem 73, ele não está "quente". Está confortavelmente dentro da faixa normal da variância aleatória. O mesmo vale para um número com contagem 49 — ele não está "frio", está apenas um pouco abaixo do esperado, dentro da variação estatística normal.
A forma técnica de dizer isso: frequências observadas que caem dentro de dois desvios-padrão do esperado não fornecem evidência de não-uniformidade. A maioria dos padrões de quente/frio que as pessoas veem é exatamente isso.
Quando um gráfico de frequência diria mesmo algo?
Há um conjunto restrito de casos em que dados de frequência poderiam indicar um efeito real:
Janelas muito longas. Em 5.000 ou 10.000 sorteios, a variância natural encolhe em relação ao esperado, e um viés real (se existisse) começaria a aparecer. Para a maioria das loterias isso significa décadas de dados, e a maior parte delas foi rigorosamente auditada nesses períodos. A resposta quase sempre é: não há viés real.
Outliers extremos. Se a contagem de um número cai a cinco ou seis desvios-padrão do esperado, vale investigar. Isso quase nunca ocorre em loterias respeitáveis. Quando ocorre, o primeiro suspeito é um erro de coleta de dados, não a física da loteria.
Comparações entre loterias com metodologia consistente. Isso é acadêmico mais do que acionável, mas é possível estudar muitas loterias em busca de desvios sistemáticos. Estudos revisados por pares sobre as principais loterias em geral encontram o esperado: os sorteios são estatisticamente indistinguíveis do aleatório.
Um guia prático de leitura
Com tudo isso em mente, eis como usar de fato um gráfico de frequência sem se enganar:
- Confirme as três variáveis. Loteria, janela, linha de base. Se alguma faltar, pare.
- Olhe a dispersão, não os extremos. A pergunta interessante não é "qual é o número mais alto?" — é "quanta dispersão há no conjunto?". Compare com a dispersão esperada para uma distribuição uniforme.
- Por padrão, assuma que a variância é ruído. O ônus da prova é sobre o desvio, não sobre a uniformidade. Se você não consegue explicar um desvio com vários desvios-padrão de dados, é ruído.
- Olhe várias janelas. Números "quentes" em uma janela raramente são "quentes" na próxima. Se a "quentura" não persiste, não era real.
- Não escolha números a partir do gráfico. Essa é a linha divisória. Gráficos de frequência descrevem o passado. Não preveem o futuro.
O que plataformas honestas fazem
Uma plataforma que leva a sério dados de frequência vai:
- Mostrar a linha de base explicitamente. Em geral, como faixa sombreada para um e dois desvios-padrão.
- Deixar você mudar a janela. Janelas diferentes respondem a perguntas diferentes. Uma plataforma que esconde isso está simplificando demais.
- Recusar-se a ranquear números como "melhores apostas". Nenhuma plataforma honesta ranqueia números por probabilidade implícita de vitória, porque não existe probabilidade implícita de vitória.
- Explicar a matemática. Você deveria encontrar uma página que mostra como a base foi calculada e por que as faixas de variância são o que são.
Gráficos de frequência como educação probabilística
Usado corretamente, um gráfico de frequência é um belo instrumento didático. Mostra a variância natural de um processo aleatório de forma imediata e quase sempre contraintuitiva. A maior parte das pessoas espera que distribuições uniformes pareçam uniformes; não parecem. Parecem irregulares. Aprender a ver essa irregularidade como esperada, e não como sinal, é o começo da literacia probabilística.
Esta é a melhor coisa que gráficos de frequência podem fazer: não escolher números, mas treinar sua intuição para como a aleatoriedade realmente se parece.
Conclusão
Um gráfico de frequência de loteria é uma contagem em uma janela, comparada a uma linha de base esperada. Ele é útil para entender quão ruidosos os sorteios aleatórios realmente são e para cortar a intuição de que pequenas variações significam algo.
Ele não é útil para escolher números. Não pode ser. Os sorteios que produziram o gráfico eram independentes entre si, o que significa que o gráfico não tem poder preditivo sobre o próximo sorteio. Isso não é uma limitação do gráfico — é uma propriedade do processo subjacente.
Se você gosta de olhar dados de frequência, experimente você mesmo e encare pelo que é: uma janela para um processo aleatório. No momento em que começa a escolher números a partir dele, o gráfico deixa de ser análise e vira superstição com um gráfico anexo.