אנליטיקה6 דק׳ קריאה

המיתוס של המספרים החמים והקרים

דירוגי מספרים חמים וקרים הם התפיסה השגויה העקשנית ביותר בסטטיסטיקה של הגרלות. מהיכן מגיע הרעיון, מדוע הוא מרגיש משכנע, ומה הנתונים באמת אומרים.

צוות LottoWise

אם תשאלו את רוב שחקני הלוטו האם מספרים יכולים להיות "חמים" או "קרים", מספר מפתיע מהם יגיד שכן. חלק יגידו לכם בביטחון אילו מספרים הם מחשיבים כחמים במשחק המקומי שלהם. מעטים יגידו שהם משחקים את המספרים החמים; מעטים יגידו שהם משחקים את המספרים הקרים. שתי הקבוצות מתייחסות לא פעם לאותם נתונים בדיוק.

זהו אחד המקרים הברורים ביותר בהסתברות שבהם האינטואיציה והמציאות מושכות לכיוונים הפוכים. המסגור של חם-וקר כה טבעי עד שהוא מרגיש כמו היגיון בריא. הוא גם שגוי. המאמר הזה עוסק בסיבה לכך — ובסיבה שכל כך קשה להרפות ממנו.

מה המשמעות של חם וקר

ברוב הקשרי הלוטו, מספרים "חמים" הם מספרים שהופיעו בהגרלות יותר מהממוצע על פני חלון זמן אחרון כלשהו. מספרים "קרים" הם מספרים שהופיעו פחות מהממוצע. החלון עשוי להיות 20 ההגרלות האחרונות, 100 האחרונות, או השנה האחרונה — ההגדרות משתנות, והשונות הזו היא חלק מהבעיה.

מהמסגור הבסיסי הזה צומחות שתי עצות מנוגדות:

  • שחקו את המספרים החמים: הם בשיא, היצמדו לתנופה.
  • שחקו את המספרים הקרים: הם באיחור, התור שלהם מגיע.

שתי הקבוצות מסתכלות על אותם נתונים ומגיעות למסקנות הפוכות. כשזה קורה בסטטיסטיקה, זה בדרך כלל סימן לכך שהמסגרת עצמה שבורה.

התשובה הסטטיסטית

עבור הגרלות לוטו אקראיות באמת — שזה למעשה כל הלוטואים הגדולים המודרניים — תדירות העבר אינה משפיעה על תדירות העתיד. הכדורים לא זוכרים אילו מהם הוגרלו לאחרונה. המכונה לא עוקבת אחרי היסטוריה. כל הגרלה היא אירוע אקראי חדש עם אותן הסתברויות בסיסיות.

זו אינה טענה תיאורטית; זו תכונה שהרגולטורים בודקים באופן פעיל. לוטואים מריצים מבחנים סטטיסטיים מקיפים על מכונות ההגרלה שלהם דווקא כדי לוודא שההגרלות עצמאיות. אם לא היו, המכונות היו נכשלות בהסמכה ולא היו משמשות.

כאשר מספר מופיע יותר מהצפוי בחלון אחרון, ישנן רק שלוש אפשרויות:

  1. שונות אקראית. התוצאה הצפויה של תהליך אקראי על פני מדגם סופי לעולם אינה אחידה בצורה מושלמת. חלק מהמספרים יהיו מעל הממוצע פשוט במקרה. על פני חלון של 20 הגרלות, השונות הזו דרמטית — מספרים יכולים להופיע 3–4 פעמים או בכלל לא, לחלוטין במקרה.
  2. טעות מדידה. טעויות בהזנת נתונים, ייחוס הגרלה שגוי, או באגים בלוגיקה של התרשים. נדיר, אבל שווה לשלול.
  3. הטיה אמיתית בהגרלה. למכונה יש פגם עדין שמעדיף מספרים מסוימים. עבור לוטואים אמינים זה נדיר עד אין קץ — כשזה קרה בעבר, זה נתפס והלוטו הושהה.

אפשרות 1 מסבירה למעשה את כל דפוסי החם/קר שאנשים רואים. אפשרויות 2 ו-3 הן מקרי חריגה.

מדוע זה מרגיש משכנע

אם המתמטיקה כל כך ברורה, מדוע המסגור של חם/קר מחזיק מעמד? משום שהאינטואיציה האנושית גרועה בכמה דברים ספציפיים שסטטיסטיקה של לוטו דורשת.

אנחנו מזהים דפוסים באגרסיביות. המוח שלנו מכוון למצוא דפוסים, גם היכן שאין. לראות מספר עולה שלוש פעמים בחמש הגרלות נרשם כדפוס, גם אם התוצאה הזו עקבית לחלוטין עם אקראיות.

אנחנו מזלזלים בהצטברות אקראית. רצפים אקראיים באמת נראים הרבה יותר מקובצים ממה שאנשים מצפים. אם תבקשו מאנשים לרשום רצף "אקראי" של הטלות מטבע, הם יפזרו ראש ועץ באופן אחיד מדי — אקראיות אמיתית כוללת רצפים, והרצפים מרגישים לא-אקראיים.

אנחנו זוכרים את הפגיעות, לא את ההחטאות. אם שיחקתם את המספרים החמים בחודש שעבר ושניים מהם יצאו, זה נדבק. שלושת החודשים שבהם הם לא יצאו פחות זכירים. זה נקרא הטיית אישור, וסטטיסטיקה של לוטו היא סביבה קלאסית עבורה.

אנחנו בוטחים יותר מדי במדגמים קטנים. "זה יצא שלוש פעמים בעשרים ההגרלות האחרונות" מרגיש כראיה חזקה. זה לא. השונות של התפלגות בינומית רחבה בגדלי מדגם כה קטנים. באופן אינטואיטיבי המדגם מרגיש גדול; סטטיסטית הוא בקושי אינפורמטיבי.

דוגמה מעובדת

הנה דרך קונקרטית לראות את השונות. דמיינו לוטו 6/49, והתחשבו רק ב-20 ההגרלות האחרונות. כל הגרלה בוחרת 6 מתוך 49 מספרים, כך שלכל מספר בודד יש סיכוי של 6/49 ≈ 12.2% להופיע בהגרלה נתונה כלשהי.

על פני 20 הגרלות, כל מספר צפוי להופיע כ-2.4 פעמים בממוצע. אבל מכיוון שזה תהליך אקראי, הספירה בפועל משתנה. עבור כל מספר ספציפי, ההסתברות שהוא יופיע:

  • 0 פעמים: כ-7.5%
  • פעם 1: כ-21%
  • 2 פעמים: כ-27%
  • 3 פעמים: כ-22%
  • 4 פעמים: כ-13%
  • 5 פעמים או יותר: כ-9%

בכל חלון של 20 הגרלות, יהיו לכם בערך 49 מספרים שמתפרסים על פני התוצאות האלה. בממוצע, 4 או 5 מהם יופיעו 4+ פעמים, ו-3 או 4 לא יופיעו כלל. אם תבחרו את אלה שהופיעו הכי הרבה ותקראו להם "חמים", תמיד תמצאו כאלה — המתמטיקה מבטיחה זאת.

הריצו את החלון קדימה בעשר הגרלות. המספרים החמים כמעט בוודאות לא יהיו אותם המספרים. הם לא היו חמים; הם פשוט היו בצד המזל של השונות, והשונות לא מתמידה.

המסגור של "איחור" שבור באותה מידה

הטיעון הראי — שמספרים קרים באים בתור — נקרא כשל המהמר, והוא שגוי באותה מידה. מספר שלא יצא ב-50 הגרלות לא נמצא בתור. יש לו בדיוק אותה הסתברות לצאת בהגרלה הבאה כפי שהייתה לו לפני 50 הגרלות, שזו בדיוק אותה הסתברות כמו לכל מספר אחר. למכונה אין שום חובה "לאזן את עצמה".

הכשל אינטואיטיבי משום שאנחנו חושבים על תהליכים אקראיים כעל תהליכים שמתקנים את עצמם. הם לא. הם חסרי זיכרון. על פני הגרלות אינסופיות התדירויות כן מתכנסות לאחידות, אך רק במובן שהשונות הטבעית מתכווצת יחסית לספירה הכוללת — לא משום שכוח כלשהו מושך את הספירות האינדיבידואליות בחזרה לכיוון הממוצע.

איך נראים הנתונים ללא המיתוס

אם תסירו את המסגור של חם/קר ותסתכלו על נתוני לוטו אמיתיים, הנה מה שתראו:

  • מספרים מתנודדים סביב הערכים הצפויים שלהם, עם כמות השונות הצפויה.
  • על פני חלונות ארוכים, התדירויות מתקרבות יותר ויותר לאחידות.
  • על פני חלונות קצרים, מתקבלים פיזורים דרמטיים-למראה שעקביים לחלוטין עם אקראיות.
  • המספרים ה"חמים" של חלון אחד כמעט לעולם אינם המספרים ה"חמים" של החלון הבא.

זו אינה תוצאה משעממת — זו למעשה החתימה של תהליך אקראי מעוצב היטב. אם המספרים החמים כן היו מתמידים, זו הייתה ראיה למכונה שבורה.

איך לבדוק בעצמכם

אם יש לכם גישה לנתונים היסטוריים של לוטו, אתם יכולים להריץ בדיקה פשוטה בפחות משעה. קחו את המספרים שיצאו הכי הרבה בחלון כלשהו (נניח, ה-10 המובילים על פני 50 ההגרלות האחרונות). עכשיו הסתכלו על 50 ההגרלות הבאות וראו איך אותם המספרים ה"חמים" ביצעו.

אם המסגור של חם/קר היה אמיתי, הם היו ממשיכים לבצע מעל הממוצע. במקום זאת תראו שהם חוזרים לצפוי — לפעמים מעט גבוה יותר, לפעמים מעט נמוך יותר, הכל בתוך רצועות שונות נורמליות.

המבחן הזה הוא אחת הדרכים הברורות ביותר לבנות אינטואיציה לאקראיות. הוא גם מוכלל: כמעט כל טענה על דפוסים חיזויים בנתונים אקראיים נכשלת באותו מבחן.

מה אנחנו עושים עם נתוני תדירות

ב-LottoWise אנחנו מפרסמים תרשימי תדירות משום שאנחנו חושבים שהנתונים מעניינים באמת — זהו חלון להתנהגות של תהליכים אקראיים, ורוב האינטואיציות של אנשים להתנהגות הזו שגויות. מה שאנחנו לא עושים הוא לדרג מספרים כבחירות "חמות" או "קרות". אנחנו לא ממליצים על מספרים לשחק, משום שאין דרך הוגנת לעשות זאת.

אם אתם רואים פלטפורמת אנליטיקת לוטו שמציעה רשימת "בחירות מובילות" שנגזרת מנתוני תדירות, הם או לא מבינים את המתמטיקה או משווקים לקהל שלא אכפת לו אם המתמטיקה נכונה. כך או כך, התוצאה זהה: הבחירות אינן טובות יותר מבחירה אקראית.

השורה התחתונה

מספרים חמים וקרים הם מיתוס, אך כזה שניתן להבין. תהליכים אקראיים מייצרים דפוסים שמרגישים משמעותיים, והאינטואיציה האנושית אינה מצוידת לראות אותם כפי שהם באמת.

הנתונים עדיין שימושיים — להבנת הסתברות, לראיית שונות טבעית בזמן אמת, לפילוח דרך אמונות תפלות על המשמעות של "אקראי". הם פשוט לא שימושיים לבחירת מספרים. שום דבר אינו, משום שלהגרלות אין זיכרון.

אם אתם נהנים לשחק בלוטו, שחקו. אם אתם נהנים מהסטטיסטיקה, למדו אותה. רק אל תבלבלו בין שתי הפעילויות, ואל תתנו לאף אחד לגבות מכם כסף עבור רשימה של "מספרים חמים" שהיא — מתמטית, באופן חד-משמעי — שווה לא כלום.