प्रायिकता7 मिनट का पठन

प्रायिकता बनाम भविष्यवाणी: डेटा वास्तव में क्या दिखाता है

लॉटरी ड्रॉ यादृच्छिक हैं, लेकिन इसका मतलब यह नहीं कि डेटा बेकार है। प्रायिकता और भविष्यवाणी के बीच अंतर समझना लॉटरी सांख्यिकी को ईमानदारी से पढ़ने की बुनियाद है।

LottoWise टीम

हर लॉटरी एनालिटिक्स प्लेटफ़ॉर्म को अंततः एक ही प्रश्न का उत्तर देना होता है: अगर ड्रॉ यादृच्छिक हैं, तो डेटा किस लिए है?

यह एक उचित प्रश्न है, और ईमानदार उत्तर वह नहीं है जो अधिकांश मार्केटिंग पेज देना चाहते हैं। डेटा आपको नहीं बताएगा कि कौन से नंबर चुनें। यह आपको और बहुत कुछ बताएगा — ड्रॉ समय के साथ वास्तव में कैसे व्यवहार करते हैं, कौन-से पैटर्न असली हैं और कौन-से भ्रम, और इन सब में प्रायिकता सिद्धांत कहाँ फ़िट बैठता है। यह लेख इसी के बारे में है।

एक वाक्य में अंतर

प्रायिकता कई परीक्षणों में यादृच्छिक घटनाओं के व्यवहार का वर्णन करती है। भविष्यवाणी किसी विशिष्ट भविष्य की घटना के परिणाम को जानने का दावा करती है।

प्रायिकता गणित है। भविष्यवाणी, जब वास्तव में यादृच्छिक घटनाओं पर लागू होती है, तो वह मार्केटिंग है।

यह अंतर अकादमिक नहीं है। यह वह कारण है कि एक ईमानदार लॉटरी एनालिटिक्स प्लेटफ़ॉर्म वर्षों के फ्रीक्वेंसी चार्ट, पुनरावृत्ति सांख्यिकी, और ट्रेंड विश्लेषण प्रकाशित कर सकता है, विजेता नंबर चुनने का कभी दावा किए बिना — और क्यों कोई भी प्लेटफ़ॉर्म जो विजेता नंबर चुनने का दावा करता है, उससे दूर हट जाना योग्य है।

लॉटरी ड्रॉ वास्तव में यादृच्छिक क्यों हैं

अधिकांश प्रमुख लॉटरियाँ — Powerball, Mega Millions, EuroMillions, Israeli Lotto — विनियमित कैलिब्रेशन, स्वतंत्र ऑडिटिंग और सार्वजनिक ड्रॉ प्रसारण के साथ यांत्रिक ड्रॉ मशीनों का उपयोग करती हैं। पूरी व्यवस्था इस तरह डिज़ाइन की गई है कि हर ड्रॉ सांख्यिकीय रूप से पहले के हर ड्रॉ से स्वतंत्र हो।

"सांख्यिकीय रूप से स्वतंत्र" का सटीक अर्थ है: अगले ड्रॉ में किसी नंबर के आने की प्रायिकता इस बात से प्रभावित नहीं होती कि वह कल खींचा गया था, पिछले सप्ताह, या सौ ड्रॉ पहले। एक मानक 6/49 लॉटरी में 13,983,816 संभव संयोजन हैं, और हर एक के खींचे जाने की ठीक वही प्रायिकता है: लगभग 1 में 14 मिलियन।

यह कोई ऐसा दावा नहीं है जो लॉटरी ऑपरेटर करना चाहते हैं — यह भौतिक व्यवस्था का गुण है। अगर यांत्रिक ड्रॉ स्वतंत्र परिणाम उत्पन्न नहीं कर रहे होते, तो नियामक इसे जल्दी पकड़ लेते (वे व्यापक सांख्यिकीय परीक्षण करते हैं), और लॉटरी बंद कर दी जाती।

तो डेटा वास्तव में क्या दिखाता है?

अगर हर ड्रॉ स्वतंत्र है, तो ऐतिहासिक डेटा आपको क्या बता सकता है? आपकी अपेक्षा से अधिक — लेकिन वह नहीं जो अधिकांश लोग उससे सुनना चाहते हैं।

फ्रीक्वेंसी एकसमान की ओर अभिसरित होती हैं। पर्याप्त ड्रॉ पर, हर नंबर लगभग समान बार प्रकट होता है। "लगभग" उस वाक्य में बहुत काम कर रहा है। कुछ सौ ड्रॉ पर, स्वाभाविक प्रसरण कुछ नंबरों को दूसरों की तुलना में स्पष्ट रूप से अधिक बार दिखाएगा। वह प्रसरण डेटा का कहने का तरीक़ा है कि "यादृच्छिक प्रक्रियाएँ अल्पकालिक में गुच्छेदार होती हैं।" यह संकेत नहीं है कि गुच्छेदार वाले "देय" हैं या "हॉट" हैं।

संयोजन व्यक्तिगत नंबरों से भिन्न व्यवहार करते हैं। किसी विशिष्ट संयोजन (मान लीजिए, 1-2-3-4-5-6) की प्रायिकता किसी अन्य के समान ही है। लेकिन यह प्रायिकता कि कुछ दो विजेता पुरस्कार पूल साझा करते हैं, लोग वास्तव में कौन-से संयोजन चुनते हैं, इस पर भारी रूप से निर्भर करती है। जन्मदिन के नंबर (1–31), क्रमिक पैटर्न, और दृश्य रूप से दिलचस्प चयन यादृच्छिकता की अपेक्षा से कहीं अधिक खेले जाते हैं।

जैकपॉट आकार भागीदारी को प्रभावित करता है, परिणामों को नहीं। बड़े जैकपॉट का मतलब है अधिक टिकट बिक्री, जिसका अर्थ है अधिक संयोजन कवर होना और विजेताओं के लिए छोटे अपेक्षित पुरस्कार हिस्से। यह वास्तविक, मापनीय और जानने योग्य है — और इसका इस बात से कोई लेना-देना नहीं है कि कौन-से नंबर आएँगे।

गैम्बलर्स फ़ैलेसी, विस्तार से

लॉटरी सांख्यिकी में सबसे आम ग़लती गैम्बलर्स फ़ैलेसी है: यह विश्वास कि यादृच्छिक प्रक्रिया में पिछले परिणाम भविष्य के परिणामों को प्रभावित करते हैं। यह दो समरूप रूपों में दिखती है:

  • "यह नंबर 50 ड्रॉ में नहीं आया — यह देय है।"
  • "यह नंबर पिछले सप्ताह आया था — यह हॉट है।"

दोनों ग़लत हैं, और एक ही कारण से: यांत्रिक ड्रॉ अपना इतिहास याद नहीं रखते। एक गेंद को पता नहीं है कि वह पिछले सप्ताह निकाली गई थी। मशीन में कोई रजिस्टर नहीं है जो कहता है "17 को अक्सर न निकालो।" प्रत्येक ड्रॉ समान अंतर्निहित प्रायिकताओं के साथ एक नई यादृच्छिक घटना है।

आप इसे एक सरल मानसिक प्रयोग से स्वयं सत्यापित कर सकते हैं। एक सिक्का दस बार उछालें और लगातार दस हेड पाएँ — 1 में 1,024 की प्रायिकता वाली घटना, लेकिन असंभव नहीं। ग्यारहवीं उछाल पर, हेड की प्रायिकता क्या है? यह अब भी 50% है। सिक्के की कोई स्मृति नहीं है। न ही लॉटरी मशीन की।

तो फ्रीक्वेंसी चार्ट प्रकाशित क्यों करें?

क्योंकि डेटा अपने आप में दिलचस्प है, और क्योंकि यह समझना कि "यादृच्छिक" कैसा दिखता है, स्वयं में एक मूल्यवान कौशल है।

फ्रीक्वेंसी चार्ट ऐसे प्रश्नों के उत्तर देते हैं:

  • पिछले वर्ष में इस लॉटरी में स्वाभाविक प्रसरण कितना गुच्छेदार है? दो वर्ष? पाँच वर्ष?
  • क्या देखी गई फ्रीक्वेंसी एकसमान से इस तरह भिन्न हैं जो सांख्यिकीय रूप से महत्वपूर्ण हो? (प्रतिष्ठित लॉटरियों के लिए, लगभग कभी नहीं।)
  • विशिष्ट जोड़ियों का पुनरावृत्ति वितरण कैसा दिखता है?
  • क्रमिक नंबर कितनी बार आते हैं? पिछले ड्रॉ से दोहराए गए नंबर?

ये प्रक्रिया के बारे में प्रश्न हैं, अगले परिणाम के बारे में नहीं। उत्तर पुनरुत्पादन योग्य, परीक्षण योग्य और — उन लोगों के लिए जो सांख्यिकी का आनंद लेते हैं — वास्तव में दिलचस्प हैं। वे आपको विजेता चुनने में मदद नहीं करेंगे, लेकिन वे आपको पैटर्न और संयोग के बीच अंतर देखने में मदद करेंगे।

ईमानदार लॉटरी एनालिटिक्स कैसा दिखता है

ऊपर बताए गए अंतर के आधार पर, यहाँ वह है जो एक डेटा प्लेटफ़ॉर्म ईमानदारी से पेश कर सकता है:

पारदर्शी कार्यप्रणाली। हर चार्ट सार्वजनिक डेटा से पुनरुत्पादन योग्य होना चाहिए। अगर कोई प्लेटफ़ॉर्म आपको नहीं बताता कि डेटा कहाँ से आया या गणना कैसे की गई, तो चार्ट को मनोरंजन मानें, जानकारी नहीं।

एकसमान वितरण आधार रेखाएँ। "एकसमान कैसा दिखेगा" दिखाने वाली संदर्भ रेखा के बिना एक फ्रीक्वेंसी चार्ट चूक से भ्रामक है। आधार रेखा के बिना स्वाभाविक प्रसरण नाटकीय दिखता है; आधार रेखा के सामने, यह आमतौर पर शोर जैसा दिखता है।

स्पष्ट समय-सीमाएँ। 20 ड्रॉ पर "हॉट नंबर" विश्लेषण आपको 20 ड्रॉ के बारे में बता रहा है। 500 ड्रॉ पर, यह आपको अंतर्निहित वितरण के निकट कुछ बता रहा है। जो प्लेटफ़ॉर्म अपनी विंडो का खुलासा नहीं करते, वे सबसे महत्वपूर्ण चर छिपा रहे हैं।

कोई भविष्यवाणी नहीं। यह स्पष्ट रेखा है। एक प्लेटफ़ॉर्म वर्णन कर सकता है कि क्या हुआ, समझा सकता है कि क्यों हुआ, और दिखा सकता है कि यादृच्छिकता वास्तव में कैसे व्यवहार करती है। जिस क्षण वह आपको बताता है कि आगे क्या खेलें, उसने एनालिटिक्स छोड़ दी है और किसी और चीज़ में प्रवेश कर लिया है।

डेटा के साथ आप क्या कर सकते हैं

अगर आप लॉटरी सांख्यिकी का आनंद लेते हैं, तो यहाँ करने योग्य चीज़ें हैं:

  • प्रसरण का अध्ययन करें। एक लॉटरी चुनें, पिछले 500 ड्रॉ देखें, और देखें कि नंबरों में कितना स्वाभाविक प्रसरण है। आप इस बात के लिए अंतर्ज्ञान बनाएँगे कि यादृच्छिक प्रक्रियाएँ वास्तव में कितनी अनियमित दिखती हैं।
  • लॉटरियों की तुलना करें। एक 5/69 ड्रॉ एक 6/49 से भिन्न व्यवहार करता है — इसलिए नहीं कि एक हॉट है, बल्कि इसलिए कि नमूना स्थान अलग है। उनकी तुलना करना संयोजनशास्त्र (combinatorics) तेज़ी से सिखाता है।
  • अपने अंतर्ज्ञानों की जाँच करें। अगर आप मानते हैं "40 से ऊपर के नंबर कम बार आते हैं," तो डेटा जाँचें। आप आमतौर पर ग़लत होंगे, और विशिष्ट रूप से ग़लत होना प्रायिकता में बेहतर होने का तरीक़ा है।
  • अन्य क्षेत्रों में गैम्बलर्स फ़ैलेसी से बचें। एक बार जब आप इसे लॉटरी डेटा में स्पष्ट रूप से देख लें, तो आप इसे हर जगह देखने लगेंगे — खेल टिप्पणी में, निवेश सलाह में, मौसम पूर्वानुमान में। यह एक हस्तांतरणीय कौशल है।

निष्कर्ष

लॉटरी डेटा वास्तव में उपयोगी है — प्रायिकता समझने के लिए, यादृच्छिकता के व्यवहार को देखने के लिए, और बहुत सी सहज-रूप से आकर्षक बकवास को काटने के लिए। यह विजेता नंबर चुनने के लिए उपयोगी नहीं है, क्योंकि कोई भी डेटा उसके लिए उपयोगी नहीं हो सकता। ड्रॉ यादृच्छिक हैं, और यादृच्छिक ही पूरी बात है।

अगर आपको लॉटरी में आनंद आता है तो खेलें। सांख्यिकी को वह मानें जो वह है: यादृच्छिक प्रक्रियाएँ वास्तव में कैसे व्यवहार करती हैं, इसकी एक खिड़की — जो अधिकांश लोगों की अपेक्षा से अधिक दिलचस्प और अधिक विरोधाभासी है।

और अगर कोई प्लेटफ़ॉर्म आपसे कहे कि कौन-से नंबर खेलें — संभाव्य रूप से, विश्वास से, संतुष्टि की गारंटी के साथ — तो याद रखें कि यादृच्छिक का क्या अर्थ है, और टैब बंद कर दें।