מחקר ישראלי-אמריקאי המבוסס על נתונים של עשרות מיליוני משתמשים ברשתות חברתיות מאפשר לנתח דפוסים של גיל תמותה, הגירה, נישואים ולהוציא מידע רב חשיבות

86 מיליון בני אדם, 5.3 מיליון משפחות, שאחת מהן כוללת לא פחות מ-13 מיליון איש הקשורים זה לזה בקשרי לידה או נישואים. מאגר הנתונים העצום הזה התאפשר בזכות האינטרנט ורשתות חברתיות, ועכשיו משתמשים בו חוקרים מארצות הברית ומישראל כדי לחקור תופעות שונות כמו התורשתיות של תוחלת החיים או דפוסי הגירה ונישואים. המחקר חושף את הפוטנציאל הגדול של מה שכונה "הדיגיטליזציה של האנושות" עבור מחקרים בתחומים שונים.

הנתונים של כל אותם בני אדם, חיים ומתים, נאספו מהאתר Geni.com, השייך לחברה הישראלית MyHeritage. באתר ניתן להכניס את פרטיך ופרטים על כל בני המשפחה הידועים לך – מתי והיכן נולדו, עם מי התחתנו, מי היו ילדיהם, מתי מתו, וכל מידע נוסף, תמונות או מסמכים שיש בידך. אחר כך משווה האתר בין הפרטים שהכנסת לפרופילים שכבר נמצאים במאגר, ומאפשר לגלות כך קשרים בין משפחות שונות.

החוקרים יצרו 5.3 מיליון אילנות יוחסין נפרדים עבור 86 מיליוני הפרופילים, לאחר שסיננו את המעטים  שהראו קשרים בלתי אפשריים, כמו מישהו שהיה אביו ובנו של אותו אדם, או מישהו בעל יותר משלושה הורים. רוב הפרופילים במחקר הם מאירופה ומצפון אמריקה, וכמעט כולם ממדינות המערב. את המחקר הובילו גו'אנה קפלניס (Kaplanis) ואסף גורדון מהמעבדה של יניב ארליך מאוניברסיטת קולומביה, המכון לחקר הגנום בניו-יורק וחברת MyHeritage, ובשיתוף טל שור מהטכניון, עומר וייסברוד ממכון ויצמן למדע וחוקרים נוספים.

ממערב אירופה לאמריקה, ולשאר העולם. התפשטות האוכלוסייה במחקר | מקור: MyHeritage, Columbia University
ממערב אירופה לאמריקה, ולשאר העולם. התפשטות האוכלוסייה במחקר | מקור: MyHeritage, Columbia University

חלק מהממצאים שעלו מהמחקר אישרו נתונים שהתגלו במחקרים קודמים, למשל כאלו שמבוססים על רישומי כנסייה של לידה ומוות. באופן לא מפתיע, נראית עלייה חדה במוות של גברים צעירים בזמן מלחמת האזרחים האמריקאית ובמלחמות העולם, וירידה בתמותת ילדים במשך המאה ה-20.

אבל מאגר נתונים כה גדול מאפשר לעשות יותר משנעשה בעבר עם מאגרים הכוללים מאות או אלפי אנשים, שלרוב מגיעים מאזור גיאוגרפי מצומצם. כדי להדגים זאת, השתמשו החוקרים במידע שבידם כדי לבחון את תוחלת החיים של האנשים באילנות היוחסין, ועד כמה הם היו קשורים לתוחלת החיים של הוריהם. כך יכלו החוקרים לחשב את התורשתיות של התכונה הזו, כלומר, לאיזה אחוז מהשוני בין בני האדם בתוחלת החיים אחראים הגנים, לעומת הסביבה. הם הגיעו למסקנה שהתורשתיות של תוחלת החיים עומדת על כ-12 אחוזים, ולפיכך רוב השוני בין אנשים נובע מהשפעות הסביבה, כמו תזונה ואורח החיים. הנתון הזה נמוך במקצת מזה שנמצא במחקרים קודמים, מצומצמים יותר.

אפשר לענות על שאלות בגנטיקה, אבל גם באנתרופולוגיה, כלכלה ובריאות הציבור. יניב ארליך | צילום: MyHeritage
אפשר לענות על שאלות בגנטיקה, אבל גם באנתרופולוגיה, כלכלה ובריאות הציבור. יניב ארליך | צילום: MyHeritage

הכל לא נשאר במשפחה

מכיוון שהנתונים כוללים את מקום הלידה של הורים ושל ילדיהם, אפשר היה לנצל אותם בשביל לבחון דפוסי תנועה והגירה. החוקרים מצאו למשל שנשים נטו לעזוב את מקום הולדתן יותר מגברים, אבל לרוב לא התרחקו מאוד. לעומת זאת כאשר גברים נדדו הם נטו לנוע למרחקים גדולים יותר, והרבו יותר להגר ממדינה למדינה. כך, היו יותר אבות שנולדו במדינה אחרת מזו שבה נולדו ילדיהם מאימהות שעשו זאת. המגמה הזו נמשכת, לפי המחקר, כבר לפחות 300 שנים, ונראית גם היום.

נתון שדווקא השתנה לא מעט עם השנים הוא המרחק הממוצע בין מקומות הלידה של בני זוג. לפני המהפכה התעשייתית רוב הזוגות נולדו במרחק של פחות מעשרה קילומטר זה מזה, אך המרחק הזה גדל והלך במאה ה-19 ובתחילת המאה ה-20. רוב האנשים שנולדו בסביבות 1950 נישאו לבני זוג שנולדו בטווח של כמאה קילומטר זה מזה.

כאשר האנשים החלו לחפש בני זוג במקומות רחוקים יותר, גם הקשר המשפחתי בין שני בני הזוג הלך וקטן – חתונות בין בני דודים מדרגה שלישית ורביעית (או לפעמים פחות) נעשו נדירות יותר. אך במפתיע, זה לא תמיד היה המצב. המרחק הממוצע בין בני זוג שנולדו בסביבות 1850 היה גדול פי שניים מזה של בני זוג שנולדו חמישים שנה קודם לכן, ככל הנראה בעקבות השינויים בתחבורה שאירעו באותם שנים. אך המרחק הגנטי בין בני הזוג דווקא קטן באותה תקופה, כלומר היה סיכוי גבוה יותר ששני בני הזוג יהיו קרובי משפחה. רק עבור אנשים שנולדו לאחר 1850 המרחק הגיאוגרפי בין הבעל והאישה התבטא גם במרחק גנטי.

התוצאות האלו מערערות את התפיסה המקובלת, לפיה השינויים בתחבורה ובאורחות החיים של בני האדם במאה ה-19, שהביאו אותם למקומות רחוקים יותר ויותר, הם שהביאו להפסקת המנהג להתחתן בתוך המשפחה. לפי הממצאים, כמה עשרות שנים חלפו מאותם שינויים ועד שנראתה ירידה רצינית בקשר הגנטי בין בני הזוג, ונראה שגורמים תרבותיים היו חשובים יותר בתהליך זה.

המחקר מראה כיצד אפשר לנצל את המידע הרב שאנשים ברחבי העולם חולקים זה עם זה ברשתות החברתיות למטרות מחקר. החוקרים מציינים ששאלות רבות בתחומים כמו גנטיקה, אנתרופולוגיה, בריאות הציבור וכלכלה עשויות למצוא מענה בזכות אותו שיתוף פעולה בין מיליוני בני אדם. אלו שאלות שעד היום היה כמעט בלתי אפשרי לחקור לעומק, שכן הן דורשות כמות בלתי נתפסת של נתונים. כעת, בפעם הראשונה, יש לחוקרים גישה למאגרי מידע שיכולים לספק את הדרישה הזו.

צפו בסרטון קצרצר על המחקר, המדגים את התפשטות האוכלוסיה המערבית במשך מאות שנים:

2 תגובות

  • אריאל

    אמינות נתוני ג'ני

    למיטב הבנתי, מרבית הנתונים ששותלים אנשים בג'ני מבוססים על זיכרון וסיפורים משפחתיים ופחות, הרבה פחות, על נתונים שנאספו מארכיונים רשמיים, מצבות וכיוצא באלה. יותר מכך, על הנתונים הלא מבוססים שנאספו מסיפורי המשפחה ומן הזיכרון, מבסס "המצטרף לג'ני, המכניס נתונים לעץ המשפחה שלו" עץ משפחה רעוע ואפילו מטעה. זאת ועוד, הנתונים הלא מבוססים שקיימים בשל כך בג'ני, מהווים "מקור-כביכול" לעצי משפחה המופקים באתרי אילנות יוחסין אחרים. באופן זה נגררות טעויות שהופכות כך למידע אמין כביכול, אבל לא מבוסס לחלוטין, אשר אף עלול לסבך אנשים המעוניינים לכתוב את תולדות משפחתם.

  • מומחה מצוות מכון דוידסוןיונת אשחר

    לכן החוקרים יצרו אלגוריתם שעבר על הנתונים

    וניפה מהם טעויות ברורות.
    התקווה היא שהכמות הגדולה של המשתמשים והעצים החופפים ייצרו מידע אמין בסך הכל. הם גם בדקו את כל מיני נתונים לעומת מאגרי מידע קטנים אבל אמינים יותר, והזהות הייתה כמעט מושלמת (כולל במאגר נתונים שכולל כאלף מהפרופילים בג'יני).