מדוע יצא לסטטיסטיקה, ולאחותה ההסתברות, שם רע כל כך? האם פול התמנון הוא באמת נביא? איך הצליח פרופסור אמריקאי לזהות תוצאות מפוברקות? ואיך אפשר לרתום את הסטטיסטיקה לזיהוי מעילות בכספים? זהו חלקו השני של הטור של רן לוי, מפיק ומגיש הפודקאסט עושים היסטוריה.
כפי שכבר ציינתי בחלק הראשון של הכתבה, הסטטיסטיקה היא כלי עזר חשוב במחקרים מדעיים רבים. כמעט כל תואר אקדמי, במדע הטבע ובמדעי הרוח והחברה גם יחד, כולל לימודי סטטיסטיקה והסתברות כחלק בלתי נפרד ממסלול הלימודים. ובכל זאת, אף שרוב החוקרים מבינים את החשיבות של ניתוח סטטיסטי זהיר וקפדני ומשתדלים להימנע משגיאות מביכות, יש טעויות שאי אפשר להימנע מהן ברמת המחקר הבודד או החוקר היחיד:טעויות שאיש אינו אשם בהן ובכל זאת יוצרות בעיה לא פשוטה בתחומי מחקר רבים. טעות כזאת היא התופעה המכונה "אפקט המגירה", וכדי להסביר אותה נפנה דווקא לעולם הכדורגל.
כמו קודמותיה, תחרות הגביע העולמי בכדורגל של 2010 הייתה משופעת בכוכבים גדולים: קסיאס, דרוגבה, חאבי, רונלדו, מסי ועוד. אך אותו מונדיאל הפגיש אותנו גם עם שני כוכבים חדשים, צפויים פחות. הראשונה הייתה הוובוזלה, אותה חצוצרה רעשנית שכיכבה ביציעי האצטדיונים, והאחר היה פול התמנון.
תמנונים הם בעלי חיים אינטליגנטיים בצורה יוצאת דופן: יש להם זיכרון מעולה והם מסוגלים לפתור חידות פשוטות בזריזות מפתיעה. יש המשווים את האינטליגנציה של התמנונים לזו של כלבים, למשל. גם פול, תמנון במרכז הימי בעיר אוברהאוזן שבגרמניה, ניחן באותה חוכמה... ולפי הטענה גם ביכולת מנטלית מסוג שונה לגמרי.
באליפות אירופה בכדורגל שנערכה שנתיים קודם לכן הצליח פול לנחש את תוצאות משחקיה של נבחרת גרמניה בארבעה מתוך שישה משחקים. ההצלחה הזהירה הזו שכנעה את מטפליו במרכז הימי לאפשר לפול לנחש את התוצאות גם בגביע העולמי של 2010, אולי כדי למשוך את תשומת לב התקשורת ולזכות בעוד כמה תיירים.
כיוון שתמנונים אינם יודעים לדבר או לכתוב, שיטת הניחוש של פול הייתה היורסטיקה מבוססת גסטרונומיה, ובמילים פשוטות יותר – אוכל. המטפל הוריד לאקווריום שני מכלי זכוכית ובהם מנות זהות של בשר צדפות – המזון האהוב על פול. על כל מכל הופיע הדגל של אחת המתמודדות, והמכל שממנו בחר התמנון לנשנש ראשון סימן מי תהיה הקבוצה שתנצח במשחק.
המשחק הראשון של גרמניה היה מול אוסטרליה ופול בחר במכל הגרמני. גרמניה ניצחה. המשחק השני היה נגד סרביה, ופול –במפגן אופי מעורר כבוד – הלך נגד הפטריוטיות המקומית והצביע בעד הסרבים. הוא צדק. במשחק השלישי התמודדה גרמניה נגד נבחרת גאנה ופול בחר בגרמניה. נו, את ההימור הזה גם מדוזה הייתה לוקחת בהליכה.
אבל כשפול קבע שגרמניה תנצח את אנגליה – וצדק, אי אפשר היה להתכחש יותר לכך שיש בתמנון הזה משהו שונה.
אוהדי כדורגל מכל העולם התגייסו כדי לבלום את כוחותיו המאיימים של פול. שף ארגנטיני פרסם בפייסבוק מתכון לבישול בשר תמנון בניסיון להפעיל עליו לחץ פסיכולוגי – ניסיון נואש למדי בהתחשב בכך שככל הידוע לנו אין לתמנונים פסיכולוגיה. כשפול חזה שגרמניה תפסיד לספרד בחצי הגמר, ראש ממשלת ספרד הציע לשלוח שומרים מטעמו כדי למנוע מאוהדי גרמניה לאכול את פול – אם כי יכול להיות שהוא רק התבדח. אני מקווה. פול השלים סדרה של שמונה תחזיות מוצלחות משמונה ניסיונות כשחזה שספרד תנצח בגמר את הולנד.
פול התמנון בוחר בספרד בגמר אליפות העולם בכדורגל ב2010
ובכן, מה סוד כוחו של התמנון? פול הלך לעולמו כעבור מספר חודשים בלבד ולקח את סודותיו עמו אל... המקום שאליו תמנונים הולכים כדי למות. ככל הנראה הוא נפח את נשמתו רק שבועות ספורים לפני שההתאחדות לכדורגל בישראל התכוונה להציע לו את תפקיד מאמן הנבחרת. מזל שלו, אם תשאלו אותי.
אבל הסטטיסטיקאים כבר יודעים את הסוד. על פי התיאוריה המקובלת, סיכויו של פול לנחש את כל התוצאות הנכונות במונדיאל, בהנחה הסבירה שכל הניחושים היו אקראיים לחלוטין, הם כאחד ל-250. זהו סיכוי לא גבוה במיוחד, אבל גם לא בלתי אפשרי. מדוע אם כן זכה פול לפרסום כה רב? התשובה טמונה בנטייה האנושית הטבעית לא להודות בכישלון.
אפקט המגירה
בכל מחקר מדעי יש סיכוי שלמרות כל המאמצים נקבל בסופו של דבר תוצאה לא סבירה. נניח לצורך העניין שאנחנו בוחנים את ההשפעה של תרופה על סוג נדיר של סרטן, ונניח שלרוע המזל התרופה הזו אינה יעילה כלל. אם מאה חוקרים ברחבי העולם יבדקו את התרופה הזו בניסויים מבוקרים, 99 מהם יקבלו את התוצאה השלילית הצפויה: התרופה לא השפיעה והסרטן לא נרפא. אבל יש סבירות מסוימת שהניסוי המאה יקבל תוצאה חיובית מסיבות שאינן קשורות כלל לתרופה עצמה: החולים המשתתפים בניסוי הבריאו מסיבה אחרת – אולי משהו בתזונה, אולי סיבה ערטילאית אחרת.
ברור שאם 99 ניסויים מגלים שהתרופה אינה יעילה ורק אחד מוצא שהיא פועלת, התרופה אינה יעילה. חד וחלק. עם זאת, בפועל 99 החוקרים שלא הצליחו לרפא את הסרטן יקחו את דוח הניסוי, יתחבו אותו במגירה ולא יפרסמו אותו לעולם. מה כבר יש לפרסם? הניסוי לא הפיק שום תוצאות מהותיות. אבל החוקר הבודד שהפיק תוצאות חיוביות ימהר לפרסם את המחקר שלו. התוצאה: עולם הרפואה יסיק בטעות שאולי התרופה החדשה יעילה. זהו אפקט המגירה.
זה כנראה גם מה שקרה לפול התמנון. סביר להניח שבכל רחבי העולם, בכל עשרת המונדיאלים האחרונים ואולי אף יותר, אנשים ניסו להיעזר בחיות כדי לנבא את תוצאות המשחקים. כיוון שחיות לא ממש מבינות בכדורגל, כל הניסיונות האלה כשלו – ולכן התקשורת לא התעניינה בהם. מי רוצה לשמוע על רקס, הכלב שלא הצליח לנחש את תוצאות הגביע העולמי? כל אותם ניסיונות כושלים אינם מגיעים לתודעת הציבור ונכנסים, באופן מטפורי, למגירה.
אבל אם מספיק חיות ינסו לנחש את התוצאות, אחת מהן תצליח –ורק הגורל העיוור קבע שיהיה זה פול התמנון. ואכן, על פי ויקיפדיה, באותם משחקים עצמם ניסו את מזלם בניחוש תוצאות המשחקים גם ליאון הקיפוד, פטי ההיפוטוטם, ג'ימי החזיר ואנטון הקוף – וכולם פספסו בשלב זה או אחר. אנטון, אגב, טען שגאנה תנצח... וזו לא הייתה הפעם הראשונה ש"הקוף" טעה בפרשנות.
אפקט המגירה, אם כן, הוא שגיאה שנגרמת כתוצאה מהאקראיות המובנית של העולם שלנו ומהאופן שבו מתפרסמים מאמרים מדעיים. כדי לנסות לשלול אותו יש כמה כתבי עת מקצועיים שהכריזו שלא יקבלו מחקרים לפרסום אם החוקרים לא ויודיעו מראש על כוונתם להתחיל בניסוי, כדי שעורכי כתב העת יוכלו לוודא שהם ידווחו על תוצאותיהם גם אם תהיינה שליליות.
חוק בנפורד
עד כה סיפרתי רק על הצדדים השליליים של טעויות סטטיסטיות והסתברותיות. כדי להשלים את התמונה הנה לכם דוגמה למקרה שבו למוזרות הכללית של הסטטיסטיקה יש דווקא השפעה חיובית.
אחד העזרים המתמטיים הנפוצים בתקופה שלפני עידן המחשב היה "ספר הלוגריתמים": חוברת שפירטה את תוצאותיו של חישוב מתמטי מסוים ונפוץ מאוד. התוצאות נרשמו בטבלאות דחוסות ובכתב קטן וצפוף, ולכן המשתמשים נהגו לעקוב באצבעם אחרי העמודות והשורות כדי לא להתבלבל.
ב-1881 הבחין האסטרונום האמריקאי סיימון ניוקומב בתופעה מרתקת. ניוקומב הרבה להשתמש בספר הלוגריתמים, ובמהלך ביקוריו בספרייה הבחין שבכל העותקים של הספר העמודים הראשונים שלו היו מלוכלכים מטביעות אצבעות הרבה יותר מהדפים האחרונים.
הטבלאות בספר הלוגריתמים מסודרות על פי סדר עולה של המספרים: 100, 101, 102 וכן הלאה. פירוש הדבר שבדפים הראשונים של הספר נמצאים המספרים שהספרה השמאלית ביותר שלהם, הראשונה, היא 1.
מדוע, שאל ניוקומב את עצמו, מתעניינים האסטרונומים דווקא בחישובים או במדידות שמתחילים במספר 1? הרי אין בזה שום היגיון. הטבע ניטרלי ואקראי ואין סיבה להניח שכאשר מודדים מרחקים, זמנים או גדלים דומים, תוצאות המדידה תהיינה מוטות דווקא למספרים המתחילים במספר 1, כמו 153, 1,830 או 1,230,900.
אבל כשניוקומב פנה לבחון את העניין בפועל, זה בדיוק מה שהוא גילה: במדידות רבות באסטרונומיה התוצאה המתקבלת היא מספר שהספרה הראשונה שלו היא 1. המספר 1 מופיע כספרה השמאלית ביותר בשכיחות גבוהה באופן מובהק: כשלושים אחוז מהמקרים. הספרה 2 מופיעה כספרה הראשונה במדידות בשכיחות נמוכה יותר, אבל עדיין גבוהה יחסית, והספרה 9 היא הנדירה ביותר – פחות מחמישה אחוזים מהמדידות.
ניוקומב לא הצליח להסביר את התוצאה שקיבל, אבל פרסם אותה במאמר מקצועי. לרוע מזלו איש לא לקח אותו ברצינות – ובאמת, איך אפשר לקחת תוצאה כזאת ברצינות? כפי שקורה הרבה פעמים, המאמר נשכח.
57 שנים מאוחר יותר, ב-1938, הבחין פיסיקאי בשם פרנק בנפורד באותה תופעה בדיוק: גם הוא השתמש בספר לוגריתמים - וגם העותק שלו היה מלוכלך מאוד בדפים הראשונים. בנפורד השקיע מאמצים אדירים, הרואיים ממש, כדי לוודא שההשערה שלו לגבי השכיחות המוגזמת של הספרה 1 בתחילת כל מדידה אכן תקפה. הוא בחן כעשרים אלף מדידות וטבלאות נתונים מכל מיני סוגים: שטחי נהרות, משקלים אטומיים של יסודות, מספרים שמופיעים בדיווחים עיתונאיים, אפילו סטטיסטיקות של משחקי בייסבול. כל נושא שבדק הניב ממצאים זהים: הספרה הראשונה הייתה 1 בכ-30 אחוז מהמקרים.
גם בנפורד כתב מאמר על מחקריו, והפעם זכה להתעניינות מצד הקהילה המדעית. התופעה המשונה הזו כונתה "חוק בנפורד" ומי שגילו בה עניין מיוחד היו דווקא כלכלנים, ובפרט אלה שמתמחים בהנהלת חשבונות.
מנהלי חשבונות מנסים כל הזמן למצוא שיטות חדשות ומתוחכמות לאתר רמאויות פיננסיות. בשנות ה-70 הציע פרופ' הל וריאן (כיום הכלכלן הראשי של גוגל) להשתמש בחוק בנפורד כדי לגלות אי סדרים בספרי חשבונות. אם הדוחות הפיננסיים תקינים, המספרים המופיעים בהם אמורים לציית לחוק בנפורד: הספרה השמאלית ביותר תהיה 1 בקרוב ל-40 אחוז מהמקרים, 2 בכ-17 אחוז מהמקרים, 3 בכ-12 אחוז מהמקרים וכן הלאה. אבל אם מישהו ניסה לזייף את המספרים בספרי החשבונות, הם לא יצייתו לחוק בנפורד. מדוע?
אחת האנקדוטות המפורסמות בעולם הסטטיסטיקה מספרת על מרצה למתמטיקה באחת האוניברסיטאות, שבכל תחילת סמסטר הטיל על הסטודנטים שלו את שיעורי הבית הבאים: חלקם יטילו מטבע 200 פעמים וירשמו את התוצאות, וחלקם לא יטילו מטבע ויגישו תוצאות מפוברקות. בשיעור הבא, כשהגישו הסטודנטים את הרשימות שלהם, המרצה העיף מבט חטוף על כל דף וקבע בתוך שניות מי הטיל מטבע אמיתי ומי בדה את התוצאות ממוחו. הניחושים שלו היו מדויקים כמעט תמיד.
סוד הצלחתו של המרצה היה טמון בחוסר היכולת של הסטודנטים –כמו כל שאר בני האדם – לזייף אקראיות בצורה אמינה. הסיכוי שבשש הטלות מטבע רצופות נקבל עץ, למשל, הוא נמוך יחסית, אבל אם נטיל מטבע מאתיים פעמים ברציפות, יש סבירות גבוהה שנקבל סדרות ארוכות של עץ או פלי. זו פחות או יותר אותה תופעה כמו זו שעליה סיפרתי בכתבה הקודמת, על ההסתברות לקבל את אותם מספרים בלוטו שבוע אחר שבוע: אם נחזור על אותו ניסוי שוב ושוב, גם התוצאות הכי לא סבירות יתרחשו בסוף.
כפי שידע המרצה, הסטודנטים בדו את התוצאות לא כתבו שרשראות ארוכות של עץ או פלי: האינטואיציה שלהם הטעתה אותם והם מניחים שאקראיות אמיתית פרושה פיזור פחות או יותר שווה של תוצאות עץ ופלי. המרצה חיפש שרשראות ארוכות של אותה תוצאה בהטלה, ואם לא מצא אף אחת כזו – הסיק שהתוצאות מזויפות.
תדירות הופעת הספרה הראשונה של קבועים פיסיקליים (ירוק) מול עקומת חוק בנפרד (אדום)
זה גם המפתח לגילוי רמאויות בספרי חשבונות באמצעות חוק בנפורד. רמאים שמנסים לזייף מספרים במסמכים הפיננסיים, משתדלים לשמור על שכיחות שווה של כל המספרים, כיוון שהם מניחים שחלוקה לא אחידה תמשוך אליהם את תשומת הלב. אם המספרים בספרי החשבונות אינם מצייתים לחוק בנפורד, הבוחנים יכולים להסיק שנדרשת בדיקה מעמיקה וחשדנית יותר של הנתונים.
שימו לב שכתבתי שהבוחנים צריכים לבצע בדיקה נוספת, ולא להניח מיד שנעשו פעולות לא כשרות. לא כל סוגי הנתונים מצייתים לחוק בנפורד, והסיבה לכך מתבררת כשמבינים מדוע הוא קיים מלכתחילה.
חוקיות לוגריתמית
בואו ניקח לדוגמה חברה שהרווח השנתי שלה צומח בעקביות, שנה אחר שנה, בחמישה אחוזים. אם בשנה הראשונה הרווח היה דולר אחד, בשנה הבאה הרווח הוא יהיה 1.05 דולרים, בשנה שלאחר מכן דולר ועשרה סנטים וקצת ובשנה שאחריה 1.15 דולרים וקצת. הרווח יגדל בהתמדה ובעקביות, ובסך הכל יידרשו לחברה 14 שנה כדי לחצות את קו שני הדולרים. אבל ברגע שתגיע לשני דולרים יחלפו רק שמונה שנים עד שתגיע לרווח של שלושה דולרים, כיוון שחמישה אחוזים מ-2 הם יותר מאשר חמישה אחוזים מ-1. הקפיצה מרווח של שלושה דולרים לארבעה דולרים תקרה בתוך שש שנים בלבד, ומתשעה דולרים לעשרה יידרשו רק שנתיים!
אבל מה קורה עכשיו? הקפיצה מרווח של עשרה דולרים לעשרים דולרים שוב תארך 14 שנים ארוכות... ומעשרים לשלושים דולרים רק שמונה שנים.
סוג כזה של צמיחה מכונה 'גידול לוגריתמי', והוא מתאפיין בכך שהתוספת לערך תלויה בערך עצמו. במקרה שלנו, תוספת של חמישה אחוזים תהיה חמישה סנט אם הערך ההתחלתי שלנו הוא דולר אחד, אבל חמישים אלף דולר אם הערך ההתחלתי שלנו הוא מיליון דולר. כפי שראינו, בגידול לוגריתמי המספרים "מבלים" הרבה זמן בתחום שבין 1 ל-2, יחסית לזמן שבין 2 ל-3 וכן הלאה, והרבה זמן בין 10 ל-20 יחסית לזמן שבין 20 ו-30 וכדומה. העובדה הזו מסבירה מדוע המספר 1 שכיח מאוד בספרה הראשונה ומדוע הספרה 9 כמעט שאינה מופיעה בתחילת המספרים.
לשם השלמות כדאי לציין שיש סיבות נוספות לקיומו של חוק בנפורד, והן קשורות לסוגים של התפלגויות סטטיסטיות, אבל השורה התחתונה היא שאסור למנהלי החשבונות להניח באופן מיידי שאם המספרים בדוחות אינם מצייתים לחוק בנפורד יש כאן בהכרח "אקדח מעשן". עוד גורמים רבים אחרים יכולים להטות את שכיחות המספרים.
למשל, בחברות מסחריות רבות מקובל שאם הוצאה כספית אינה עוברת רף מסוים אפשר לאשר אותה במסלול מהיר יותר: למשל עד 500 שקל צריך אישור של הבוס הישיר ומעל הסכום הזה נחוץ אישור של סמנכ"ל כספים. נוהג כזה יעוות לחלוטין את ההתפלגות הסטטיסטית של המספרים, כיוון שקבלני משנה רבים יעדיפו להוציא חשבונית עד 499.99 שקל במקום להתעסק בבירוקרטיה מתישה בשביל עוד כמה שקלים מסכנים.
גל עוד נזהרים ולוקחים בחשבון את כל הגורמים האחרים, חוק בנפורד הוא בהחלט כלי רב עוצמה בזיהוי תרמיות פיננסיות, ואכן בעשרים השנים האחרונות הורשעו לא מעט נוכלים, במיוחד בארצות הברית, אחרי שמעשי ההונאה שלהם נחשפו באמצעות חוק בנפורד. הסטטיסטיקה אולי יכולה אולי, אבל לעתים היא גם מוציאה את האמת לאור.
ברור אם כן שלסטטיסטיקה ולהסתברות יש מקום מרכזי בחיי היומיום שלנו, וברור גם שרובנו מתקשים להתמודד עם הדקויות והמלכודות שהן מציבות בפנינו. הדרך היחידה כמעט לשפר את המצב הזה היא באמצעות חינוך והשכלה, על כן נשמעים בשנים האחרונות קולות הקוראים לחשוב מחדש על האופן שבו אנחנו מלמדים מתמטיקה בבתי הספר התיכוניים.
לדברי מתמטיקאים מסוימים, כגון ארתור בנג'מין, לימודי המתמטיקה בתיכון מוקדשים בעיקר לאלגברה ולחשבון דיפרנציאלי ואינטגרלי. אין ספק שאלה תחומים חשובים, אבל עיקר תרומתם היא עבור אלה שימשיכו לתארים מתקדמים במקצועות הריאליים. עבור כל השאר הם לא ממש מועילים. סטטיסטיקה, לעומת זאת, יכולה להיות שימושית גם עבור מי שלא פנה לתחומי ההנדסה והמדע.
סופר המדע הבדיוני המפורסם ה"ג וולס טען אותו דבר כבר לפני יותר ממאה שנה. "בעתיד", כתב, "הבנת הסטטיסטיקה תהיה תנאי הכרחי לאזרחות טובה, לא פחות מהיכולת לכתוב ולקרוא".
רן לוי
סופר, מפיק ומגיש הפודקסט הפופולרי עושים היסטוריה. מוכר גם בזכות ספריו "פרפטום מובילה", "האוניברסיטה הקטנה של המדעים" ו"הקוף שידע לאהוב", וכותב במגוון רחב של אתרים וכתבי עת מדעיים.
הערה לגולשים
אם אתם חושבים שההסברים אינם ברורים מספיק או אם יש לכם שאלות הקשורות לנושא, אתם מוזמנים לכתוב על כך בפורום ואנו נתייחס להערותיכם. הצעות לשיפור וביקורת בונה יתקבלו תמיד בברכה.