באוקטובר 2010 הארץ הודהמה על ידי הופעתם של שני רצפי מספרי לוטו זהים ( 13, 14, 26, 32, 33, ו-36 ) בהפרש של כשלושה שבועות. האם זהו מעשה רמאות או צירוף מקרים בלתי סביר. ובכן, אין דרך לקבוע זאת באופן ודאי בלי חקירה פלילית (!) אבל ע"י שימוש בסטטיסטיקה ניתן לנסות להעריך מה הסבירות למקרה כזה, בהנחה ולא היה זיוף תוצאות (כי הרי אם היה,ניתן לזרוק את כל החישובים לפח).

ובכן, משחק הלוטו בנוי כך: יש לנחש 6 מספרים מתוך 37. בנוסף יש לנחש גם את "המספר החזק" - מספר אחד מתוך 8 על מנת להכפיל את הפרס. לצורכי החישוב נתעלם מהמספר החזק (שבמילא לא חזר על עצמו במקרה שפורסם בעיתונות). הסיכוי לניחוש של רצף נתון של 6 מספרים מתוך 37 הוא 37/(!6*!31) או בתוצאה סופית, בערך 1 ל- 2.33 מליון. לצורך הנוחיות בהמשך נכנה סיכוי זה בשם α. הסיכוי לקבלת 2 רצפים זהים בתאריכים ספציפים היא זהה – הסיכוי לקבלת הרצף הראשון הוא 1 ל-1 (כי הרי זה לא חשוב איזה רצף יצא וחייב לצאת איזשהו רצף) והסיכוי לקבלת הרצף השני זהה לניחוש של רצף ספציפי, קרי – גם 1 ל- 2.33 מיליון. לא סיכוי כזה להיט...


דוכן לוטו ביפן (התמונה באדיבות ויקיפדיה)

אבל... זהו סיכוי שמתייחס לאירוע מאוד ספציפי. בפועל, אם ההפרש בין שני הרצפים היה חודשיים גם אז הייתה העיתונאות יוצאת בכותרות. אם המקרה היה קורה בשנת 2003 גם אז הטוקבקיסטים היו צועקים "מושחתים נמאסתם". זאת אומרת שעלינו לקחת בחשבון עוד שני משתנים – ההפרש בין ההגרלות שיראה לאדם מהישוב כמוזר והסיכוי שעל פני תקופה ארוכה נראה מקרה שכזה.

ראשית, מהו הפרש שיראה מוזר? שימו לב, זוהי איננה שאלה סטטיסטית כלל! הסיכוי ל-2 רצפים זהים בהפרש של שבוע זהה לסיכוי לקבלת 2 רצפים זהים בהפרש של 37 שנים. אלא מה? הפסיכולוגיה האנושית גורמת לאדם הממוצע לחשוד במפעל הפיס במקרה הראשון ולפטור את המקרה השני כקוריוז מוזר. השאלה (הפסיכולוגית בעיקרה) כאן היא: כמה קצר הפרש הזמנים בין 2 הרצפים צריך להיות על מנת האדם הממוצע יחשוב שאין סיכוי שדבר כזה יקרה באופן טבעי. ההימור שלי הוא על שנתיים, אבל זו רק תחושה לא מבוססת. לצורך השאלה, נשתמש במספר זה - שנתיים מינוס חגים ללא הגרלות – נניח 100 שבועות, או 200 הגרלות (יש שתי הגרלות בשבוע).

שנית, כאשר אנשים מנסים לחשב מה הסיכוי שמאורע נדיר כזה יקרה, הם נוטים להזניח את כל הזמן לפני המאורע בו לא קרה דבר שכזה. מפעל הפיס קיים משנת '51, זאת אומרת שישנם כמעט 60 שנה של הגרלות ללא רצפים חוזרים בזמן קצר. כאשר מחשבים את ההסתברות למאורע ללא הזמן שקדם לו, אנו עושים עוול סטטיסטי גדול מאוד. אם כך, על פני איזו תקופת זמן עלינו לבדוק את הסיכוי למאורע? לצורך הבדיקה שלנו נבדוק מה הסיכוי למאורע כזה במהלך חייו של אדם ממוצע (78 שנים, או 3,900 שבועות או 7,800 הגרלות).

סיכום לפני החישוב הסופי:

נבצע את המדידה על פני 7,800 הגרלות

לכל הגרלה יוצמד כעין "חלון" של פלוס/מינוס שנתיים עליו תבוצע מדידה אחת. ההפרש בין 2 רצפים זהים יהיה 199 הגרלות קדימה או אחורה (סה"כ 398 הגרלות). כדי להקל על החישוב נתיר להגרלות בקצוות (ההגרלות הראשונה עד ה-200 וההגרלות ה-7,600 עד 7,800) להיות משוות גם להגרלות שחורגות ממספרים אלו (מתחת ל-0 או מעל ל-7,800). אפקטיבית, זה יגדיל את אורך החיים של האדם ההיפוטתי שלנו בשנתיים.

נבדוק את הסיכוי לשתי רצפים זהים בלבד ונזניח את הסיכויים הקלושים למספר גבוה יותר של רצפים זהים. אם כך, הבה נבדוק מה הסיכוי לרצף זהה בחלון של הגרלה מס' 1 ובהגרלה נוספת בטווח המותר (198- ועד 200). הגרלה 1 יכולה לקבל α רצפים והגרלה נוספת מתוך ה-398 חייבת לקבל את אותו רצף. שאר 397 ההגרלות יקבלו רצפים שונים זאת מזאת ומהרצף הכפול. את כל ההכפלה הזאת יש לחלק בכלל מרחב המדגם – סך כל הרצפים בכל ההגרלות:

[389 * α *(α-1) * (α - 2) * (α - 3)...(α - 397)] / α^399

זהו למעשה הסיכוי לקבל 2 רצפים זהים (בלבד) בהפרש של עד שנתיים אחד מהשני. סיכוי זה שווה לבערך 0.000165478 או קצת יותר מאלפית אחוז. לא משהו בכלל, נכון?

אבל אין אנו בוחנים רק הגרלה מס' 1 אלא גם את 7,799 אחיותיה. מכיוון שלכל אחת מההגרלות התנאים דומים הסיכוי בכל אחת לקבלת 2 רצפים הוא זהה לחישוב הקודם. אלא מה, שבחישוב זה הכללנו כל צירוף של הגרלות פעמיים, קרי – כאשר בדקנו את החלון של הגרלה מס' 1,500 והצמדנו לה בחישוב את הגרלה מס' 1,675, עשינו את אותו הדבר שבדקנו את החלון של הגרלה מס' 1,675 והצמדנו לה את הגרלה מס' 1,500. לכן את כל ההסתברויות יש לחתוך בחצי על מנת לפצות על הכפילות הזאת (יש את ההגרלות במספרי קצה אשר לחלקם לא תהיה את הבעיה הזו, אבל מדובר במספרים קטנים ולצורך החישוב נזניחם).

אם כך, הסיכוי לכל חלון להוציא 2 הגרלות זהות הוא 0.000082739 לשם הנוחות, נכנה מספר זה בשם β. אם כך הסיכוי שבחלון אחד כל ההגרלות זרות זו לזו הוא 1-β. ולכן הסיכוי שבכל החלונות כל הגרלות יהיו זרות זו לזו הוא הכפלת הסיכויים זה בזה או 7800^(1-β) = כ-52% סיכוי שאין 2 רצפים בהפרש של שנתיים ומטה מה שאומר שהסיכוי שבמהלך חייו של אדם ממוצע הוא יזכה לראות שני רצפים זהים בהפרש של שנתיים או פחות, הוא 48% - הרבה יותר מכל מיני מספרים שנזרקו באויר. כאמור החישוב הזה קצת גס ומספר מצומצם של חישובים לא נכללו בו לשם הנוחות, אבל התשובה האמיתית תהיה רחוקה כאחוזים בודדים מהאחוז האמור.

באפריל 2015 עלו בגורל בהגרלת הלוטו בארץ 5 מספרים עוקבים (32, 33, 34, 35, 36) - האם לדעתכם זה דבר הגיוני או רמאות?


שלומי דגן
דוקטורנט, המחלקה לכימיה ביולוגית
מכון ויצמן למדע



הערה לגולשים
אם אתם חושבים שההסברים אינם ברורים מספיק או אם יש לכם שאלות הקשורות לנושא, אתם מוזמנים לכתוב על כך בפורום. אנו נתייחס להערותיכם. הצעות לשיפור וביקורת בונה יתקבלו תמיד בברכה.

9 תגובות

  • יהודה

    שלומי, אני מזמין אותך לאתגר נוסף בעניין מפעל הפיס.

    שלומי שלום. ישנה תופעה משונה בתוצאות ההגרלות של מפעל הפיס לאורך זמן: בכל רמות הפרסים למעט השני והראשון, התפלגות הזכיות היא כ-40% יותר לטובת אלו שמילאו טופס רגיל על פני אלו שמילאו טופס שמכפיל את הפרס ("דאבל לוטו"). זה מובן, משום שכנראה יותר אנשים מסתפקים בטופס רגיל שעולה ממחצית מטופס שמכפיל את גובה הפרס. אלא מאי? ברוב המקרים, כאשר עולה בגורל הפרס הראשון או השני, משום מה רבים יותר הזוכים בדאבל לוטו מאשר ברגיל. עד כמה תוצאה כזו רחוקה מההסתברות המקרית? דרוש לשם כך מומחה לסטטיסטיקה. האם תרצה לקחת על עצמך את האתגר הזה?
    אגב, ההגרלה הנוכחית, 3429, היא היוצא מן הכלל המעיד על הכלל, שכן היא משקפת התפלגות נורמלית.

  • צ'קו

    מחשבים לא אמינים

    כאשר ההגרלה מבוצעת ע"י מכשיר מכני, יותר קל לגלות רמאות. במחשב אין דבר כזה מספר אקראי, תאמינו לי, אני מומחה לקריפטוגרפיה בחברת שבבים ענקית. לכן הרמאות בהגרלה ממוחשבת יותר סבירה. זו אגב בעייה גם לגבי הבחירות - בישראל עדיין מצביעים ע"י פתקים וטוב שכך. יום טוב לכולם.

  • רפאל

    לוטו בישראל שוד לאור יום למה לא נותנים לזכות כול שבועה

    לקחתם את המספרים שכולם שלחו המחשב בדק אותם תוך שלוש דקות אתם כבר יודעים את המספרים אחר קח אתם מתכנתים את המכשיר שיוציא מספרים שהמחשב פלט וברחתי מהמספרים שאנשים שלחו בטופס בקיצור אתם גנבים

  • אנונימי

    צודק שודדים לאור היום

  • rmi

    הסתברויות זכיות בלוטו

    אני מחפש מישהו מומחה בתחום הלוטו,שיכול להגיד לי בוודאות מוחלטת אלו אחוזי הסתברויות סוכוי שיש בכל מדינה בעולם שניתן להרוויח .אני מבין אם אני לא טועה שישראל זה 1 על 18 מיליון שזה הרבה.נכון שיש יותר מישראל ששם הסיכוי פחות ויש גם יותר .

  • אלון

    שאלות

    שלומי אבל מדובר בהפרש של 7 משחקים

    אני ישתמש בחישוב שלך
    [398 * α * (α-1)(α-2)(α-3)…(α-397)] / α399

  • שלומי דגן.

    כמו ששכתבתי

    השאלה כאן היא גם בתחום הפסיכולוגיה. בוא ונניח שהיו 14 שבועות הפרש בין 2 ההגרלות. האם גם אז YNET היו יוצאים בכותרת? לדעתי - בודאי. לכן - אתה חייב לכלול הפרשים יותר גדולים בין ההגרלות בתוך החישוב שלך.

  • אלון

    אלון --> שלומי

    YNET כותבים בשביל פרסומות הם יכתבו כותרת מפוצצת רק שתכנס ויכתבו כתבה לא ברור ומרגיזה
    רק כדי שתכתוב שטוית בפורם שלהם.

    ברור שאף אחד לא יכל לדעת לעולם ב100%
    עם זה "צירוף מקרים או רמאות".
    ומי שרוצה להאמיין שזה רמאות אז זה בעיה שלו.

    אבל מה הסיכווי שמשהו כזה יקרה אפשר לחשב
    וזה מעניין בזכות השאלה הזו למדתי על "כשל המהמר" ו"בעיית יום ההולדת". (כשל המהמר ידעתי טבעי אבל לא ידעתי ת'שם)

    וגם כתבתי את מה שכתבתה בדיוק ב"המעגל המתמטי".
    שהחישוב של משהו שקרה אחרי שקרה זה קצת טיפשי.

    אבל רצתי לדעת מה הסיכווי באמת ותחישוב
    מתוך סקרנות אם אני יצליח.

    אבל עוד לא סימתי. (כי זה ממש קשה.)

    אני יחזר עם החישוב שאני יצליח
    ותגיד לי מה אתה חושב על החישוב.

  • שלומי