हॉट और कोल्ड नंबर का मिथक

अगर आप अधिकांश लॉटरी खिलाड़ियों से पूछें कि क्या नंबर "हॉट" या "कोल्ड" हो सकते हैं, तो आश्चर्यजनक रूप से कई लोग हाँ कहेंगे। कुछ लोग आत्मविश्वास से बताएँगे कि उनके स्थानीय खेल में वे किन नंबरों को हॉट मानते हैं। कुछ कहेंगे कि वे हॉट नंबर खेलते हैं; कुछ कहेंगे कि वे कोल्ड नंबर खेलते हैं। दोनों समूह अक्सर एक ही डेटा का संदर्भ देते हैं।

यह प्रायिकता के सबसे स्पष्ट उदाहरणों में से एक है जहाँ अंतर्ज्ञान और वास्तविकता विपरीत दिशाओं में खिंचते हैं। हॉट-कोल्ड ढाँचा इतना स्वाभाविक लगता है कि यह सामान्य ज्ञान जैसा प्रतीत होता है। यह ग़लत भी है। यह लेख इसी बारे में है — क्यों, और इसे छोड़ पाना इतना कठिन क्यों है।

हॉट और कोल्ड का अर्थ क्या है

अधिकांश लॉटरी संदर्भों में, "हॉट" नंबर वे नंबर होते हैं जो किसी हाल की विंडो में औसत से अधिक बार ड्रॉ में आए हैं — लॉटरी नंबर फ्रीक्वेंसी की हाल की विंडो। "कोल्ड" नंबर वे होते हैं जो औसत से कम बार आए हैं। यह विंडो पिछले 20 ड्रॉ, पिछले 100, या पिछले वर्ष की हो सकती है — परिभाषाएँ भिन्न होती हैं, और यह विविधता स्वयं समस्या का हिस्सा है।

इस बुनियादी ढाँचे से दो विपरीत सलाहें उत्पन्न होती हैं:

हॉट नंबर खेलें: वे अच्छा प्रदर्शन कर रहे हैं, गति के साथ बने रहें।
कोल्ड नंबर खेलें: उनकी बारी बाकी है, अब उनका समय आने वाला है।

दोनों समूह एक ही डेटा देख रहे हैं और विपरीत निष्कर्ष निकाल रहे हैं। जब सांख्यिकी में ऐसा होता है, तो यह आमतौर पर संकेत है कि ढाँचा ही त्रुटिपूर्ण है।

सांख्यिकीय उत्तर

उन लॉटरी ड्रॉ के लिए जो वास्तव में यादृच्छिक (random) हैं — जो मूलतः सभी प्रमुख आधुनिक लॉटरी हैं — पिछली फ्रीक्वेंसी का भविष्य की फ्रीक्वेंसी पर कोई प्रभाव नहीं पड़ता। गेंदें यह याद नहीं रखतीं कि हाल ही में कौन-सी निकाली गई थीं। मशीन इतिहास ट्रैक नहीं करती। प्रत्येक ड्रॉ समान अंतर्निहित प्रायिकताओं के साथ एक नई यादृच्छिक घटना है।

यह कोई सैद्धांतिक दावा नहीं है; यह एक ऐसा गुण है जिसकी नियामक (regulators) सक्रिय रूप से जाँच करते हैं। लॉटरियाँ अपनी ड्रॉ मशीनों पर व्यापक सांख्यिकीय परीक्षण करती हैं, ठीक इसी को सत्यापित करने के लिए कि ड्रॉ स्वतंत्र हैं। अगर वे न हों, तो मशीनें प्रमाणन में विफल हो जातीं और उनका उपयोग नहीं होता।

जब कोई नंबर हाल की विंडो में अपेक्षा से अधिक बार आता है, तो केवल तीन संभावनाएँ होती हैं:

यादृच्छिक प्रसरण (random variance)। किसी सीमित नमूने पर यादृच्छिक प्रक्रिया का अपेक्षित परिणाम कभी पूर्णतः एकसमान नहीं होता। कुछ नंबर शुद्ध संयोग से औसत से ऊपर रहेंगे। 20 ड्रॉ की विंडो में यह प्रसरण नाटकीय होता है — नंबर 3–4 बार आ सकते हैं या बिल्कुल नहीं आ सकते, पूरी तरह संयोग से।
मापन त्रुटि। डेटा एंट्री की ग़लतियाँ, ग़लत ड्रॉ श्रेय, या चार्ट के तर्क में बग। दुर्लभ, लेकिन ख़ारिज करने योग्य।
ड्रॉ में वास्तविक पक्षपात। मशीन में कोई सूक्ष्म दोष है जो कुछ नंबरों को अनुकूलता देता है। प्रतिष्ठित लॉटरियों के लिए यह अत्यंत दुर्लभ है — जब कभी ऐसा हुआ है, पकड़ा गया है और लॉटरी रोक दी गई है।

लोग जो हॉट/कोल्ड पैटर्न देखते हैं, उनमें से लगभग सभी विकल्प 1 से आते हैं। विकल्प 2 और 3 अपवाद हैं।

यह आश्वस्त करने वाला क्यों लगता है

अगर गणित इतना स्पष्ट है, तो हॉट/कोल्ड ढाँचा क्यों बना रहता है? क्योंकि मानव अंतर्ज्ञान कई ऐसी विशिष्ट चीज़ों में कमज़ोर है जिनकी लॉटरी सांख्यिकी माँग करती है।

हम आक्रामक रूप से पैटर्न ढूँढ़ते हैं। हमारे मस्तिष्क पैटर्न पहचानने के लिए अनुकूलित हैं, भले ही वे मौजूद न हों। किसी नंबर का पाँच ड्रॉ में तीन बार आना एक पैटर्न जैसा लगता है, भले ही वह परिणाम पूरी तरह यादृच्छिकता के अनुरूप हो।

हम यादृच्छिक क्लस्टरिंग को कम आँकते हैं। वास्तव में यादृच्छिक अनुक्रम अपेक्षा से कहीं अधिक गुच्छेदार दिखते हैं। अगर आप लोगों से "यादृच्छिक" सिक्के की उछाल लिखने को कहें, तो वे हेड और टेल को बहुत समान रूप से वितरित करेंगे — असली यादृच्छिकता में लकीरें (streaks) होती हैं, और वे लकीरें ग़ैर-यादृच्छिक लगती हैं।

हम हिट याद रखते हैं, मिस नहीं। अगर आपने पिछले महीने हॉट नंबर खेले और उनमें से दो आए, तो वह याद रह जाता है। जो तीन महीने वे नहीं आए, वे कम याद रहते हैं। इसे confirmation bias कहा जाता है, और लॉटरी सांख्यिकी इसके लिए पाठ्यपुस्तक जैसा वातावरण है।

हम छोटे नमूनों पर बहुत भरोसा करते हैं। "पिछले बीस ड्रॉ में यह तीन बार आया" मज़बूत साक्ष्य जैसा लगता है। वास्तव में नहीं। इतने छोटे नमूनों पर द्विपद वितरण (binomial distribution) का प्रसरण चौड़ा होता है। सहज रूप से नमूना बड़ा लगता है; सांख्यिकीय रूप से वह मुश्किल से जानकारीपूर्ण है।

एक उदाहरण के ज़रिए

प्रसरण देखने का एक ठोस तरीक़ा। कल्पना करें एक 6/49 लॉटरी की, और केवल पिछले 20 ड्रॉ पर विचार करें। प्रत्येक ड्रॉ 49 में से 6 नंबर चुनता है, इसलिए किसी भी एक नंबर के किसी एक ड्रॉ में आने की प्रायिकता 6/49 ≈ 12.2% है।

20 ड्रॉ में, प्रत्येक नंबर औसतन लगभग 2.4 बार आने की अपेक्षा है। लेकिन चूँकि यह एक यादृच्छिक प्रक्रिया है, वास्तविक गणना भिन्न होती है। किसी विशिष्ट नंबर के लिए, उसके प्रकट होने की प्रायिकताएँ:

0 बार: लगभग 7.5%
1 बार: लगभग 21%
2 बार: लगभग 27%
3 बार: लगभग 22%
4 बार: लगभग 13%
5 या अधिक बार: लगभग 9%

किसी भी 20-ड्रॉ विंडो में, आपके पास लगभग 49 नंबर इन परिणामों पर बिखरे होंगे। औसतन, उनमें से 4 या 5 चार या अधिक बार आएँगे, और 3 या 4 बिल्कुल नहीं आएँगे। अगर आप सबसे अधिक बार आने वाले नंबर चुनकर उन्हें "हॉट" कहें, तो आप हमेशा कुछ पा लेंगे — गणित इसकी गारंटी देता है।

विंडो को दस ड्रॉ आगे बढ़ाएँ। हॉट नंबर लगभग निश्चित रूप से वही नहीं होंगे। वे हॉट नहीं थे; वे केवल प्रसरण के अनुकूल पक्ष पर थे, और प्रसरण स्थायी नहीं रहता।

"ओवरड्यू" ढाँचा भी उतना ही त्रुटिपूर्ण

विपरीत तर्क — कि कोल्ड नंबरों की बारी है — को गैम्बलर्स फ़ैलेसी कहा जाता है, और यह भी उतना ही ग़लत है। 50 ड्रॉ में न आया कोई नंबर "ओवरड्यू" नहीं है। अगले ड्रॉ में आने की उसकी प्रायिकता बिल्कुल वही है जो 50 ड्रॉ पहले थी, जो बिल्कुल वही है जो हर अन्य नंबर की है। मशीन का "संतुलन बनाने" का कोई दायित्व नहीं है।

यह भ्रांति सहज है क्योंकि हम यादृच्छिक प्रक्रियाओं को स्व-सुधार करने वाला मान लेते हैं। वे ऐसी नहीं हैं। वे स्मृतिहीन (memoryless) हैं। अनंत ड्रॉ पर फ्रीक्वेंसी एकसमान की ओर अभिसरित होती हैं, लेकिन केवल इस अर्थ में कि कुल गणना की तुलना में स्वाभाविक प्रसरण सिकुड़ जाता है — इसलिए नहीं कि कोई बल व्यक्तिगत गणनाओं को माध्य की ओर खींचता है।

मिथक के बिना डेटा कैसा दिखता है

अगर आप हॉट/कोल्ड ढाँचे को हटा दें और असली लॉटरी डेटा देखें, तो यह दिखता है:

नंबर अपने अपेक्षित मानों के इर्द-गिर्द उतार-चढ़ाव करते हैं, अपेक्षित प्रसरण की मात्रा के साथ।
लंबी विंडो पर, फ्रीक्वेंसी एकसमान के निकट और निकट आती जाती है।
छोटी विंडो पर, आपको नाटकीय दिखने वाले फैलाव मिलते हैं जो पूरी तरह यादृच्छिकता के अनुरूप हैं।
एक विंडो के "हॉट" नंबर लगभग कभी अगली विंडो के "हॉट" नंबर नहीं होते।

यह कोई उबाऊ परिणाम नहीं है — यह वास्तव में एक सुचारु रूप से डिज़ाइन की गई यादृच्छिक प्रक्रिया का हस्ताक्षर है। अगर हॉट नंबर वास्तव में स्थायी रहते, तो यह एक ख़राब मशीन का प्रमाण होता।

स्वयं जाँच कैसे करें

अगर आपके पास किसी लॉटरी का ऐतिहासिक डेटा है, तो आप एक घंटे से कम समय में एक सरल जाँच कर सकते हैं। किसी विंडो में सबसे अधिक आने वाले नंबर लें (मान लीजिए, पिछले 50 ड्रॉ में टॉप 10)। अब अगले 50 ड्रॉ देखें और जाँचें कि उन "हॉट" नंबरों ने कैसा प्रदर्शन किया।

अगर हॉट/कोल्ड ढाँचा वास्तविक होता, तो वे बेहतर प्रदर्शन करते रहते। इसके बजाय आप देखेंगे कि वे अपेक्षित पर लौट आते हैं — कभी थोड़ा ऊपर, कभी थोड़ा नीचे, सब सामान्य प्रसरण बैंड के भीतर।

यह परीक्षण यादृच्छिकता के लिए अंतर्ज्ञान बनाने के सबसे स्पष्ट तरीक़ों में से एक है। यह सामान्यीकरण भी करता है: यादृच्छिक डेटा में भविष्यसूचक पैटर्न के लगभग हर दावे को यह वही परीक्षण असफल कर देता है।

हम फ्रीक्वेंसी डेटा के साथ क्या करते हैं

LottoWise पर हम हर लॉटरी के लिए फ्रीक्वेंसी चार्ट प्रकाशित करते हैं जिसे हम ट्रैक करते हैं, क्योंकि हमें लगता है कि डेटा वास्तव में दिलचस्प है — यह यादृच्छिक प्रक्रियाओं के व्यवहार की एक खिड़की है, और उस व्यवहार के बारे में अधिकांश लोगों के अंतर्ज्ञान ग़लत हैं। जो हम नहीं करते, वह है नंबरों को "हॉट" या "कोल्ड" पिक के रूप में रैंक करना। हम खेलने के लिए नंबरों की सिफ़ारिश नहीं करते, क्योंकि ईमानदारी से ऐसा करने का कोई तरीक़ा नहीं है।

अगर आप ऐसा कोई लॉटरी एनालिटिक्स प्लेटफ़ॉर्म देखें जो फ्रीक्वेंसी डेटा से निकाली गई "टॉप पिक्स" सूची देता हो, तो वे या तो गणित को ग़लत समझ रहे हैं या ऐसे दर्शकों के लिए मार्केटिंग कर रहे हैं जिन्हें इसकी परवाह नहीं कि गणित सही है या नहीं। परिणाम दोनों तरह से एक ही है: पिक्स यादृच्छिक से बेहतर नहीं हैं।

निष्कर्ष

हॉट और कोल्ड नंबर एक मिथक हैं, लेकिन एक समझ में आने वाला मिथक। यादृच्छिक प्रक्रियाएँ ऐसे पैटर्न उत्पन्न करती हैं जो अर्थपूर्ण लगते हैं, और मानव अंतर्ज्ञान उन्हें जैसा वे हैं वैसा देखने के लिए सुसज्जित नहीं है।

डेटा अब भी उपयोगी है — प्रायिकता को समझने के लिए, स्वाभाविक प्रसरण देखने के लिए, "यादृच्छिक" के अर्थ से जुड़ी अंधविश्वासों को काटने के लिए। यह केवल नंबर चुनने के लिए उपयोगी नहीं है। कुछ भी नहीं है, क्योंकि ड्रॉ के पास स्मृति नहीं है।

अगर आपको लॉटरी खेलने का आनंद आता है, तो खेलें। अगर आपको सांख्यिकी पसंद है, तो उसका अध्ययन करें। बस दोनों गतिविधियों को मिलाएँ नहीं, और किसी को भी आपसे "हॉट नंबरों" की सूची के लिए पैसे न लेने दें जो — गणितीय रूप से, निस्संदेह — कुछ भी मूल्य की नहीं है।