「ホット・コールド数字」という神話
ホット・コールド数字のランキングは、宝くじ統計において最も根強い誤解です。その考えがどこから生まれ、なぜ説得力を感じさせるのか、そして実際のデータは何を示しているのかを解説します。
多くの宝くじプレイヤーに「数字に『ホット』や『コールド』はあるのか」と尋ねると、驚くほど多くの人が「ある」と答えます。地元のゲームでどの数字がホットだと自分は考えているか、自信をもって語る人もいます。ホットな数字を買うという人もいれば、コールドな数字を買うという人もいます。そして両者が参照しているのは、同じデータであることが多いのです。
これは、直感と現実が正反対の方向に引っ張り合う、確率論のなかでも最もわかりやすい事例のひとつです。ホット・コールドという枠組みはあまりにも自然で、常識のように感じられます。しかし、それは誤りです。本記事では、なぜそれが誤りなのか、そして、なぜそれを手放すのがこれほど難しいのかを取り上げます。
ホットとコールドの意味
多くの宝くじの文脈では、「ホット」な数字とは、最近の宝くじ数字の出現頻度のある期間において、平均より多く抽選に登場した数字を指します。「コールド」な数字とは、その逆に平均より少ない頻度でしか登場しなかった数字です。期間は、直近20回、直近100回、あるいは直近1年など、定義にばらつきがあり、そのばらつき自体が問題の一部でもあります。
この基本的な枠組みから、正反対の2つのアドバイスが生まれます。
- ホット数字を買え: 調子がよいのだから、勢いに乗り続けるべき。
- コールド数字を買え: 出遅れているから、そろそろ出る番だ。
両者は同じデータを見て、正反対の結論を導いています。統計の世界でこういうことが起きるとき、それはたいてい、枠組みそのものが破綻しているサインです。
統計的な答え
本当に無作為に行われる宝くじ抽選 — 現代の主要な宝くじは基本的にすべてこれに該当します — においては、過去の出現頻度が将来の頻度に影響を与えることはありません。抽選ボールは直近でどれが引かれたかを覚えていません。マシンも履歴を記録しません。各抽選は、同じ確率構造のもとで行われる、まったく新しい無作為なイベントです。
これは理論上の主張ではなく、規制当局が実際に検査している性質です。宝くじ運営者は、抽選が独立していることを検証するために、抽選機に広範な統計テストを実施しています。独立していなければ、その機械は認証を得られず、使われません。
ある期間に、ある数字が期待値を超えて登場した場合、考えられる理由は次の3つしかありません。
- 無作為なばらつき。 無作為プロセスの結果は、有限のサンプルで完全に均一になることはありません。ある数字が純粋な偶然で平均を上回ることはあります。直近20回の期間では、このばらつきは劇的で、純粋な偶然だけで、ある数字が3〜4回登場したり、まったく登場しなかったりし得ます。
- 測定誤差。 データ入力ミス、抽選情報の誤帰属、チャートのロジックのバグなど。稀ですが、除外して考える価値はあります。
- 抽選における実際のバイアス。 機械に微妙な欠陥があり、特定の数字を好む状態。主要な宝くじではほぼ起こりません。過去に発生した場合は発見され、該当の宝くじは一時停止されました。
人々が目にするホット・コールドのパターンの大半は、1番で説明できます。2番と3番は例外的なケースです。
なぜ説得力を感じるのか
計算がこれほど明快なのに、なぜホット・コールドの枠組みは残り続けるのでしょうか。それは、宝くじ統計で必要とされるいくつかの具体的な事柄に、人間の直感が不向きだからです。
私たちは積極的にパターンマッチする。 私たちの脳は、パターンが存在しない場所でも見つけ出すように調整されています。5回中3回、ある数字が登場するのを見ると、それがランダム性と完全に整合していても、パターンとして認識されます。
無作為な塊をイメージするのが苦手。 真の無作為な系列は、人々の予想よりもはるかに塊状に見えます。「ランダムな」コイン投げを書き出すよう依頼すると、人は表と裏を均等に散らしすぎます。本当のランダム性には連続があり、その連続は非ランダムに感じられます。
当たりを覚えていて、外れを忘れる。 先月ホット数字を買って2つが的中したら、その記憶は残ります。的中しなかった3か月のことは覚えにくい。これは確証バイアスと呼ばれ、宝くじ統計はその典型的な環境です。
小さなサンプルを信じすぎる。 「直近20回で3回出た」は、強い証拠のように感じられます。しかしそうではありません。二項分布の分散は、そのような小さなサンプルサイズでは広く、直感的には十分なサンプルに見えても、統計的にはほとんど情報価値がありません。
具体的な例
ばらつきを実感できる具体例を示します。6/49の宝くじを想定し、直近20回の抽選を考えます。各抽選では49の数字から6つが選ばれるため、任意の1つの数字がその抽選に登場する確率は 6/49 ≈ 12.2% です。
20回の抽選では、各数字の期待出現回数は平均で約2.4回。ただし、無作為プロセスであるため、実際のカウントはばらつきます。特定の数字が次の回数登場する確率は、おおよそ以下のとおりです。
- 0回: 約 7.5%
- 1回: 約 21%
- 2回: 約 27%
- 3回: 約 22%
- 4回: 約 13%
- 5回以上: 約 9%
任意の20回の期間では、49個の数字がこれらの結果に広がって分布します。平均して、4〜5個は4回以上登場し、3〜4個は一度も登場しません。最も多く登場した数字を取り出して「ホット」と呼べば、必ず見つかります — 数学的にそうなるのです。
期間を10回分ずらしてみてください。ホット数字はほぼ確実に同じではなくなります。それらはホットだったのではなく、たまたまばらつきの幸運側にいただけで、ばらつきは持続しません。
「出遅れ」の枠組みも同様に破綻している
鏡像の議論 — つまりコールドな数字は「そろそろ出る番」だという議論 — はギャンブラーの誤謬と呼ばれ、同じく誤りです。50回登場していない数字が「番が来ている」わけではありません。その数字が次回に登場する確率は、50回前とまったく同じであり、他のどの数字とも同じです。マシンに「帳尻を合わせる」義務はありません。
この誤謬が直感的に感じられるのは、人が無作為プロセスを自己修正的なものと捉えがちだからです。しかし実際はそうではなく、記憶を持ちません。無限回の抽選では、頻度は確かに一様に収束しますが、それは個々のカウントを平均に引き戻す力が働くからではなく、自然なばらつきが総回数に対して相対的に縮むからにすぎません。
神話を剥がしたときにデータはどう見えるか
ホット・コールドの枠組みを剥がし、実際の宝くじデータを見ると、次のような姿が見えます。
- 数字は期待値の周りで、想定どおりのばらつきの範囲で変動する。
- 長期間を見れば、頻度は一様分布に近づく。
- 短期間では、無作為性と完全に整合する劇的な見た目のばらつきが生じる。
- ある期間の「ホット」数字は、次の期間ではほとんど「ホット」ではない。
これは退屈な結果ではありません — 実は、よく設計された無作為プロセスのしるしなのです。もしホット数字が本当に持続していたら、それは壊れた機械の証拠です。
自分で確かめる方法
宝くじの過去データにアクセスできるなら、1時間もかからない簡単なチェックを実行できます。ある期間(たとえば直近50回)で最も多く登場した上位10個の数字を取ります。次の50回を見て、その「ホット」数字がどう振る舞ったかを確認してください。
もしホット・コールドの枠組みが本物なら、引き続き期待を上回って登場するはずです。実際に目にするのは、期待値に回帰する姿です — 少し上回ることもあれば、少し下回ることもあり、いずれも通常のばらつきの範囲内に収まります。
この検証は、無作為性に対する直感を育てる最も明快な方法のひとつです。そして、それは一般化できます — 無作為データにおける予測的パターンの主張のほとんどは、この同じテストで失敗します。
頻度データに対して私たちが行うこと
LottoWise では、追跡するすべての宝くじの頻度チャートを公開しています。このデータは本当に興味深いからです — 無作為プロセスがどう振る舞うかを垣間見ることができ、多くの人の直感はその振る舞いを見誤っています。一方で、数字を「ホット」や「コールド」の買い目としてランク付けすることはしません。どの数字を買うべきかをおすすめすることもしません。誠実な方法でそうする手段はないからです。
頻度データから「おすすめの買い目」リストを提示する宝くじ分析プラットフォームがあれば、それは数学を誤解しているか、数学の正しさを気にしない層に売り込んでいるかのいずれかです。いずれにしても結果は同じ — その買い目は無作為と変わりません。
結論
ホット・コールド数字は神話ですが、理解できる神話です。無作為プロセスは意味ありげに見えるパターンを生み出し、人間の直感はそれを正しく見抜くようにはできていません。
データ自体は、依然として有用です — 確率を理解するため、自然なばらつきを見るため、「無作為」が意味するものをめぐる迷信を断ち切るために。ただ、数字を選ぶのには役立ちません。何ものも役立ちません。抽選が記憶を持たないからです。
宝くじを楽しむなら、楽しんでください。統計を楽しむなら、研究してください。ただ、この2つの活動を混同しないでください。そして、「ホット数字」のリストに対して誰かがお金を請求することを許してはいけません — それは、数学的に、曖昧さなく、価値ゼロなのですから。