על בינה מלאכותית ולוחות חרס עתיקים

למרות מאמצים רבים, מדענים הצליחו לפענח עד כה רק כ-20 אחוז ממאות אלפי כתובות בכתב יתדות שהתגלו בחפירות ארכיאולוגיות. האם הבינה המלאכותית תשיג את פריצת הדרך?

חת מחזיתות המחקר מבטיחות של זמננו נולדה מחיבור מפתיע בין שתי פריצות דרך של האנושות שיותר מ-5,000 שנה מפרידות ביניהן. מצד אחד המצאת הכתב באלף הרביעי לפני הספירה, בין הפרת לחידקל, ששיגרה את האנושות למסלול האצה טכנולוגי וכלכלי שמוסיף להניב לנו פירות על עצם היום הזה; ומצד שני מהפכת הבינה המלאכותית שאנו נמצאים בעיצומה, ואין לדעת מה יהיו ממדי השפעתה בעתיד.

שני מאמרים של חוקרים ישראלים, שהתפרסמו בשבועות האחרונים, משתמשים בטכנולוגיה החדשה כדי לפענח טקסטים שנכתבו בכתב היתדות הקדום. כדי להבין אותם ואת האופן שבו המדע משתמש בבינה מלאכותית כדי לפענח את מסתרי ההיסטוריה האנושית, צריך ראשית להבין את מהותן של שתי המהפכות הללו.

של מי השורה הזאת?

ביולי השנה הודיעה OpenAI, אחת מהחברות המתקדמות בעולם בתחום פיתוח בינה מלאכותית, שהיא מזמינה אנשים נבחרים לנסות את מודל השפה החדש שלה, GPT-3. המודל תורגל על טריליון מילים, כמות ששקולה ליותר מעשרה מיליון ספרים. הוגדרו בו יותר מ-175 מיליארד פרמטרים פנימיים לקבלת החלטות, ולטענת מפתחיו הוא מסוגל לייצר בעצמו טקסט מכל סוג שיזמינו ממנו.

התוצאות חוללו סערה. אחד המוזמנים, דאגלס סאמרס-סטיי (Summers-Stay), ביקש מ-GPT-3 לכתוב עבורו סיפור קצר וסיפק לתוכנה רק את שם הסיפור ואת זהות המחבר: "קריסליס, מאת ניל גיימן (Chrysalis, by Neil Gaiman). לא רק שלסיפור שהוא קיבל ללא דיחוי היו התחלה, אמצע וסוף קוהרנטיים, היגיון ואפילו הומור, אלא שהוא ניחן בסגנונו הייחודי של הסופר. למעשה, היו מעריצים של גיימן שהתקשו להבין אם אכן מדובר בסיפור מקורי של אלילם או שזה חיקוי בלבד.

חיקוי כמעט מושלם לסגנון של הסופר המקורי. הסיפור "של ניל גיימן" שחיבר בפועל GPT-3 | צילום מסך מתוך reddit

תוך ימים ספורים החלו לצוץ טקסטים נוספים. התברר למשל כי בוט המבוסס על GPT-3 פעל במשך שבוע ברשת החברתית Reddit ופירסם אלפי תשובות לשאלות בפורומים. הבוט זוהה והושבת רק עקב תדירות התגובות שלו ואורכן, כי היה ברור שאדם לא יכול להתמיד במשך ארבע-חמש שעות ללא הפוגה בכתיבה של תגובה בכל דקה, כאשר כל תגובה היא בת שש פסקאות. עד השבתתו זכו רבות מתגובותיו של הבוט לאהדת הגולשים, שכן הן כללו בדיחות לא רעות, תובנות מפתיעות ואינטראקציות מעניינות.

במקביל הצליח הסטודנט למחשבים ליאם פור (Porr) מאוניברסיטת ברקלי לשים את ידו על מפתח השימוש ב-GPT-3 ושעשע את עצמו בהפקת בלוג מפוברק. מדי יום הוא הזין לתוכנה כותרת וכמה מילים והניח לה ליצור מהם מהם פוסט מלא, כך יום אחרי יום במשך שבועיים. הבלוג צבר פופולריות ואף דורג כבלוג המוביל ברשת חדשות הטכנולוגיה הפופולרית Hacker News. בשלב הזה החליט פור לחתום את ההרפתקה בפוסט שהתפרסם תחת הכותרת ההולמת "מה הייתי עושה עם GPT-3 אלמלא הייתי אדם מוסרי".

בעקבות ההתרגשות שעורר הבלוג, ביקש בספטמבר עיתון הגרדיאן הבריטי מפור להריץ פעם אחת אחרונה את GPT-3, כדי שיסביר בעצמו ב-500 מילים לקוראים "מדוע בני אדם אינם צריכים לחשוש מבינה מלאכותית". קשה שלא לחוש צמרמורת קלה בעת קריאת הטקסט הבהיר והמשכנע, ולכן גם פרדוקסלי, שכתב הבוט תחת הכותרת "רובוט כתב את המאמר הזה במלואו. אתם מפחדים כבר, בני אנוש?"

ממש בימים האחרונים יצא לאור Pharmako-AI - הספר הראשון שנכתב בשיתוף GPT-3 - שיחות בנושאי זהות, אקולוגיה, קוסמולוגיה וסמי הזיה. הביקורות משבחות וטוענות שהספר הוא טריפ לא קטן בפני עצמו.

בינה מלאכותית, אם כן, הבשילה טכנולוגית לכלי רב עוצמה, שלא פעם אף צולח את מבחן טיורינג ומשטה בבני אדם לחשוב שהוא אחד מהם. אנשים רבים רואים בזה איום, ואכן יש סכנות: צבא של בוטים מבוססי GPT-3 יכול בהוראת מפעיליו להציף את הרשתות החברתיות בכזבים או לשכתב באופן אמין את כל ויקיפדיה. אבל כמו כל כלי בשירות האדם, בינה מלאכותית יכולה גם להועיל. בכתבה אחרת כבר בחנו את התועלת שיש לבינה המלאכותית בתחום הרפואה. כעת מתברר שאפשר לנצל את עוצמתה למלאכה המאתגרת של פענוח מנגנוני השפה המורכבים להפליא של כתב היתדות.

הבדלים בגודל ובעוצמה. המחשה ויזואלית של יכולת החישוב של GPT-3 לעומת אדם | מקור: Wikimedia commons, public domain

של מי החיטה הזאת?

כתב היתדות הוא כנראה הכתב הקדום ביותר שפיתחה האנושות, וממצאים ארכיאולוגיים מעלים שנעשה בו שימוש בשוּמֶר הקדומה כבר לפני כ-5,500 שנה. כתב החרטומים המצרי, שהחל להתפתח כנראה כמאתיים שנה לאחר מכן בהשראה עקיפה, הפך בהדרגה לאב הקדמון של כל מערכות הכתב שנמצאות כיום בשימוש ברחבי העולם, פרט לאלה שהתפתחו במזרח אסיה. כתב היתדות, לעומת זאת, דעך ונעלם לאחר יותר מ-3,000 שנה, והידע על אודותיו נגוז ונעלם מאז המאה הראשונה לספירה ועד לעת המודרנית.

לוח קיש, שוּמֶר (כיום עירק) 3,500 לפנה"ס | מקור: מוזיאון אשמוליאם, אוקספורד, אנגליה

במשך אלפי שנה כתב היתדות נחקק על לוחות חימר, וכ-600 אלף הלוחות הכתובים שנמצאו עד כה מעניקים לנו את האשנב הקדום ביותר לתיעוד שהותירה התרבות האנושית על עצמה. מהתרבות המסופוטמית שהמציאה את כתב היתדות ירשנו חלק מיסודות תרבותנו: המצאת הגלגל, יסודות האסטרונומיה, גרסאות קדומות של סיפורי התנ"ך, ספרי חוקים, מפות ועוד. בלוחות יש כמעט הכול: מסִפְרוּת מופת ועד רשימות מכולת, מספרי חוקים מורכבים ועד מתכוני בירה, ספרי רפואה ומתמטיקה, יצירות מוזיקליות ואפילו שיעורי בית בני 4,600 שנה – כולל הטעויות. כן, מתברר שגם אז לא היה פשוט להכפיל ב-164,571, כפי שהתבקש לעשות התלמיד ביש המזל, מה גם שהמתמטיקה אז הייתה על בסיס 60, מזכרת שהשוּמֶרים הקדומים הנחילו לנו באופן שבו אנו מחשבים זמן, זוויות ונקודות ציון גיאוגרפיות אלפי שנים אחרי שעברנו לבסיס העשרוני.

לוחות כתב יתדות אשוריים במוזיאון הבריטי | צילום: The British Museum

אבל למרות הרצון העז לחשוף את הידע האצור בלוחות, ולמרות העבודה העצומה המושקעת בכך, הפענוח מתקדם לאיטו וכחצי מיליון לוחות – יותר מארבע חמישיות מאלה שנחשפו עד כה – לא נקראו מעולם. לא פעם מגיעה תגלית מסעירה רק כי בשעה טובה הגיעו לקרוא לוח ששוכב כבר עשרות שנים במחסני מוזיאונים. דוגמה טובה לכך הייתה ב-2016, כשבמרתפי המוזיאון הבריטי פוענח לוח מהמאה השנייה לפנה"ס, שעליו חישובים אסטרונומיים שנעשו בטכניקה מתמטית שעד אז חשבו שהומצאה 1,500 שנה מאוחר יותר. מדוע המומחים מתקשים כל כך בפענוח כתב היתדות, ואיך יכולה בינה מלאכותית לסייע בכך?

האבולוציה של כתב היתדות

ככל הידוע לנו כיום, האנושות המציאה את הכתב ארבע פעמים במקומות שונים ברחבי העולם. בכל פעם התהליך החל בפיקטוגרמות, כלומר תמונות קטנות המייצגות עצמים יומיומיים ועוברות עם הזמן הפשטה הולכת וגוברת.

סמלים בסיסיים בכתב היתדות השומֵרי, כתב החרטומים המצרי וכתב האנזי הסיני. בין כל שורה מפרידות מאות שנים. | איור: גסטון מספרו, מהספר "Recueil de travaux relatifs à la philologie et à l'archéologie égyptiennes et assyriennes", 1870

במקביל להפשטה שעברו הציורים הקטנים, הם החלו לקבל בשוּמֶר גם משמעויות נוספות. כל פיקטוגרמה החלה לסמל לא רק את העצם השלם – למשל ציפור – אלא גם את ההברה הראשונה של שמו. כך, באמצעות צירופי הברות, יכלו לבטא מילים שאין להן פיקטוגרמה משלהן. אם לדוגמה נדמיין שיש בעברית פיקטוגרמה שמתארת מים ונשתמש בה כדי לבטא את ההברה "מַה" ובנוסף שדיוקן קטן של הרצל מבטא את ההברה "הֵר", הרי שצירוף הפיקטוגרמות המייצגות ״מים״ ו״הרצל״ ייצור את המילה "מהר". זוהי קפיצה עצומה משפה סימבולית המבוססת על תמונות, לשפה פונטית המבוססת על צלילים.

למטה אפשר לראות כמה דוגמאות להתפתחות השוּמֶרית מפיקטוגרמות לסמלי מילים/צלילים. למשל הפיקטוגרמה השנייה מסמלת אישה, ואפשר לראות בה הדים לאנטומיה הנשית. הסמל להרים נראה כמו שלוש גבעות, ואילו הסמל לשפחה משלב את שני קודמיו, שכן השוּמֶרים הביאו את שפחותיהם מההרים. ככל שהסמלים הופכים מופשטים יותר בחלוף הזמן, החיבור החזותי למשמעות אובד בהדרגה.

התפתחות מפיקטוגרפים לסמלים בכתב יתדות | מקור: Mason, William Albert, Public Domain

קושי לפענח

אם כל סמל מייצג מילה או הברה, ויש מילון לקריאת סמלים, מדוע קשה לנו כל כך לקרוא את כתב היתדות? מדוע גם מומחים שהשתלמו עשרות שנים בפענוח לוחות עשויים להזדקק לימים על גבי ימים כדי לקרוא לוח חדש ואיך בינה מלאכותית תוכל לעזור?

בדרך לפענוח הלוחות עומדים מכשולים רבים. הראשון נוגע לחומר עצמו: הסמלים נחקקו על גבי חרס, חומר לא עמיד שנוטה להתבלות ולהישבר. בהתאם לכך רבים מהממצאים פגומים וחלקיים. האתגר השני הוא ריבוי הסמלים, שמספרם עולה על 900. למעשה המספר גדול הרבה יותר, כי הסמלים השתנו שוב ושוב במשך השנים, כך שסימן שהופיע על לוח בן 2,500 שנה יהיה שונה מהסמל המקביל לו בלוח בן 4,500 שנה.

קושי נוסף נובע מכך שבכתב היתדות אין רווחים בין הסמלים. קשה לדעת אם הסמל שלפנינו עומד בפני עצמו כפיקטוגרמה, או שמא זו הברה השייכת לתחילת המילה הבאה, לסוף הקודמת או לאמצע מילה ארוכה. בנוסף, סמלים מופיעים לא פעם גם כסמלי-עזר (determinatives) שנועדו לסייע בהבנת סמל סמוך, ואז אין להגות אותם כלל. אם לא די בזה, סמל עשוי לייצג מגוון רחב של מילים וצלילים, וכמו כן אפשר גם לייצג כל צליל באמצעות סמלים רבים. יש למשל 15 סמלים לפחות שבאמצעותם אפשר לבטא את ההברה gu.

סמל אחד, מגוון צלילים ומשמעויות במהלך תקופה אחת בלבד בשוּמֶר | מקור: קולו אור, לפי אירווינג פינקל

ולבסוף, יש לדעת באיזו שפה נכתב הלוח: באלפי שנות קיומו שימש כתב היתדות לכתיבה בשפות רבות, שלכל אחת מהן צלילים משלה ואוצר מילים ייחודי לה. בהתאם לכך אותו סמל ייצג מילים שונות בכל שפה ולכן צלילים אחרים. לדוגמה, הסמל ל"אלוהות", המופיע בראש הטבלה השנייה נקרא בשוּמֶרית עתיקה כ-"AN", על שם אל השמיים וראש הפנתיאון השוּמֶרי. אבל באכדית, שהיא שפה שמית, המילה לאל זהה לעברית, ולכן הסמל ייקרא כ-EL או IL. בסך הכל, בשילוב כל התקופות, האזורים והשפות שבהן הסמל הופיע, יש לא פחות מעשר אפשרויות להגות אותו כהברה, וכן אפשרויות נוספות כשהוא נכתב כמילה שלמה, ולפעמים הוא רק סמל עזר שלא מבטאים כלל. בקיצור – בהצלחה למתרגם!

כדי לסבך עוד יותר את המצב, שפות שונות ערבבו מילים, הברות ואיותים משפות אחרות, כפי שמדגים הסרטון:

אם כן, חוקרת שמנסה לקרוא לוח בכתב יתדות ניצבת בפני אתגר עצום. גם אם מצב הלוח סביר, וגם אם היא מכירה היטב את הסמלים מהתקופה הרלוונטית ויודעת באיזו שפה הלוח כתוב, יש דרכים רבות לפרש כל סמל למשמעויות ולצלילים, וכל פירוש תלוי בסמלים שלפניו ואחריו – ולכל אחד מהם בתורו שלל פירושים אפשריים. אין פלא, אם כן, שבכל העולם יש כיום רק כמה מאות קוראי כתב יתדות.

הבינה המלאכותית מגויסת לעזרה

בשנת 1998 החל מיזם בינלאומי לסריקה ודיגיטציה של כל לוחות כתב היתדות. בשילוב עם פרויקטים אחרים שיצאו לדרך הצטבר מסד נתונים גדול למדי שעליו יכולות תוכנות בינה מלאכותית לעבוד. כדי לפענח ולתרגם לוח סרוק או מצולם יש לעבור כמה שלבים, ולכל אחד מהם נתפרה אסטרטגיית התמודדות אחרת של בינה מלאכותית.

השלב הראשון הוא לזהות את הסמלים שעל הלוח ולהפוך אותם לקוד דיגיטלי. כל אות בכל שפה מוכרת כיום, מיוצגת על ידי מספר ביוניקוד (Unicode), התקן הבינלאומי לייצוג טקסט במחשבים, ובמסגרת פרויקט מורכב שנמשך חמש שנים הוטמעו בו גם אלף הסמלים המוכרים של כתב היתדות. אם נזהה את הסמלים על לוח חימר ונקודד אותם ל-Unicode, נוכל לעבוד על המסמך שנקבל כמו בכל שפה אחרת – לחפש, להחליף גופן, לבדוק שכיחויות של מילים, להריץ תוכנת תרגום ועוד.

אך הזיהוי והקידוד של הסמלים אינם מלאכה קלה, אפילו למומחה אנושי, קל וחומר לתוכנה. החרס סובל מבליה ומשברים, אופן כתיבת הסמלים השתנה במרוצת השנים והלוחות מכוסים כתב צפוף מכל צד אפשרי.

לוח סרוק מכל צדדיו. הכתב חורג לכל הצדדים ומתאפיין בעקמימות תלת-ממדית | צילום: צילום: Cuneiform Digital Library Initiative, שימוש הוגן

עבור שלב ראשון זה פותח בין השאר פרויקט GigaMesh ("גיגה-מש", משחק מילים על שמו של האפוס הספרותי הקדום "עלילות גלגמש", שנכתב במקור בכתב יתדות). מדובר בתוכנה בקוד פתוח שמשתמשת בסריקות תלת-ממד, ולפעמים גם סריקות טומוגרפיה ממוחשבת (CT) ומפעילה מסננים חישוביים מסובכים כדי לזהות סמלים גם בלוחות פגועים או שחוקים.

צילום מסך מ-GigaMesh. אייקון התוכנה, בעיגול מימין למטה, הוא המילה "צומת" (קָסְקָאל) בכתב יתדות, סמל למפגש בין לוחות החרס למחשב

כלים חישוביים שפותחו באותה אוניברסיטה וגם באוניברסיטאות אחרות מסייעים לחלץ את הסמלים שזוהו ולקודד אותם ליוניקוד.

לוח שנמצא בחורבות ארמונו של המלך אשורנסירפל. מימין: תוצאות הקידוד למסמך Unicode | צילום: Yale Peabody Museum of Natural History

מִצאו את המילה

לאחר שהלוח הומר בהצלחה למסמך יוניקוד, השלב הבא הוא לפענח איזה צליל מייצג כל סמל ואם הוא עומד בפני עצמו או מצטרף למי מהסמלים הסמוכים לו ליצירת מילה אחרת. מדובר כאמור במשימה קשה ומורכבת שגם מומחים גדולים בתחום מתקשים בה. קבוצות מחקר ניסו לפתח בינה מלאכותית שתתמודד עם האתגר, אך עד לאחרונה אף אחת מהן לא התקדמה מעבר להוכחת היתכנות ואחוזי ההצלחה שלהן היו נמוכים מדי להיות שימושיים.

מאמר שפרסם לאחרונה צוות ישראלי בראשות שי גורדין מאוניברסיטת אריאל, בכתב העת PLOS ONE, עשוי לשנות את התמונה, שכן לטענת החוקרים הם השיגו 97 אחוזי הצלחה בפירוש המילים וחלוקתן. הצוות אף פתח לשימושה של כלל הקהילה האקדמית את תוכנת עיבוד השפה הטבעית (NLP) שכתב, שנקראת "אכדמיה" (Akkademia), משחק מילים על שמה של השפה האכדית.

מאמר נוסף, שהתפרסם לפני כחודש בכתב העת PNAS, ניסה לתקוף באמצעות בינה מלאכותית בעיה אחרת: השלמת מילים חסרות בלוחות שבורים או שחוקים. כולנו מכירים את מנגנוני השלמת המילים שפועלים כשאנחנו כותבים הודעות בטלפון. הצוות הישראלי, בראשות איתן פתיה מאוניברסיטת בר אילן, לקח טכנולוגיה כזאת, שנקראת "רשתות עצבים סדרתיות" (Recurrent Neural Networks) וניסה להחיל אותה על מסמכי היוניקוד. הרשתות תורגלו על אלפי טקסטים כאלה, והתוכנה בנתה לעצמה מאגר של כללים בהתאם למבנים הספציפיים והנוקשים למדי של המשפטים הבבליים.

שיעורי ההצלחה שלה היו טובים: ב-85 אחוז מהמקרים המילה הראשונה שהציעה אכן הייתה המילה החסרה, וב-95 אחוז מהבדיקות המילה החסרה הייתה בין חמש ההצעות המובילות שהתוכנה סיפקה. כלי כזה יכול להיות לעזר רב לבלשן ששוקד על פענוח לוח שחסרות בו מילים.

מסתמן אם כן שהמאמץ המרוכז לפענוח ותרגום כתב יתדות באמצעות בינה מלאכותית עומד להזניק קדימה את הידע שלנו על התרבות המסופוטמית הקדומה, שבמובנים רבים סיפקה את היסודות שעליהם ניצבת התרבות המודרנית כולה. הכלים שמשתכללים והולכים יאפשרו לנו לזהות ולחלץ טקסטים עתיקים, לפענח את הסמלים, לתרגם אותם ואפילו להשלים מילים חסרות, והכל ללא מגע יד אדם. מפגש פסגה בין טכנולוגיות התקשורת המתקדמות ביותר של זמנן, זו של 3,500 שנה לפני הספירה וזאת של שנת 2,020 לספירה.