איך הפסקנו להבין מה המחשב חושב?

רשתות נוירונים חוללו מהפכה עצומה בפיתוח בינה מלאכותית. עם זאת, לא ברור אפילו למתכנתים איך הן פותרות בעיות ומה ההשלכות של זה עלינו

האזינו לגרסה מוקלטת של הכתבה.
הכתבה הוקלטה בידי הספרייה המרכזית לעיוורים ולבעלי לקויות ראייה

לרשימת כל הכתבות הקוליות באתר

כשאנחנו רואים תמונה של בעל חיים פרוותי עם זנב, כולנו נדע לזהות בקלות אם מדובר בחתול או בכלב. אבל אם נעצור לרגע ונחשוב על זה, נגלה שאנחנו לא באמת מבינים איך עשינו את זה.

כשמנסים להסביר מה ההבדל בין חתול וכלב אנו מתייחסים בדרך כלל למאפיינים כמו מבנה האף, תווי הפנים ותכונות דומות נוספות. בבסיס ההסבר הזה נמצאת הנחה לא מובנת מאליה – שאנחנו יודעים מהם איברי הפנים של חתולים וכלבים. אך כשמתכנת רוצה ליצור אלגוריתם – מעין מתכון המורכב מרצף של הוראות ותנאים – שיאפשר למחשב להבדיל בין חתולים לכלבים, הוא לא יכול להרשות לעצמו להניח הנחה כזאת. המחשב יודע לעבד רק תכונות יסודיות ופשוטות של התמונה.

הפיזיקאי המפורסם ריצ'רד פיינמן (Feynman) יצר ניסוי מחשבתי שממחיש היטב את הקושי להסביר דבר אך ורק בעזרת תכונותיו היסודיות. דמיינו שאתם מדברים בטלפון עם חייזר מגלקסיה רחוקה, שיודע עברית אך גופו שונה לגמרי מכל דבר שמוכר לנו. אם ננסה לומר לו "לחתול יש פרצוף יותר שטוח מאשר לכלב" ניענה בתהייה "מה זה פרצוף?". כנראה נזכה לתגובה דומה גם לגבי עיניים, אף ואוזניים. נוכל להמשיך ולנסות להסביר מהם כל חלקי הפנים של כלבים וחתולים, אך זו תהיה שיחה ארוכה ומייגעת.

אילו יכולנו לשלוח לחייזר תמונות, משימתנו הייתה הרבה יותר קלה. היינו שולחים צילומים של כלבים וחתולים וכך הוא היה לומד לזהות מי הוא מי. אך זה יוביל אותנו בחזרה לנקודת ההתחלה. אומנם החייזר יבין איך נראים כלבים ואיך נראים חתולים, אך לא ידע להסביר איך הוא מבדיל ביניהם מעבר להכללה על סמך דוגמאות.

בדרך זו, של למידה עצמית על סמך דוגמאות רבות, אנו מקנים כיום למחשב את היכולת להבדיל בין חיות ומאפשרים לו עוד מגוון אדיר של כישורים. הענף המדעי העוסק בכך נקרא "למידת מכונה", ואחת הדרכים העיקריות ליישם את תהליך הלמידה היא באמצעות מודל ששואף לחקות את אופן הפעולה של המוח: רשת נוירונים.

לנו קל מאוד להבדיל בין כלב לחתול. אבל איך בעצם אנחנו עושים את זה? חתול וכלב | KDdesignphoto, Shutterstock

איך זה פועל?

נוירון (תא עָצָב) הוא סוג התא העיקרי שמרכיב את המוח ואת כל רשת העצבים שלנו. התא כולל גוף מרכזי שממנו יוצאות הרבה שלוחות קטנות, הנקראות דנדריטים, שבאמצעותן התא מקבל אותות מתאי עצב אחרים. שלוחה ארוכה יותר, שנקראת אקסון, משמשת את התא להעביר אותות לתאי עצב רחוקים. כך נוצרת רשת סבוכה עם דינמיקה מורכבת למדי, שבה כל תא עצב מגיב לסך הגירויים שהוא מקבל משכניו ומשפיע על אחרים.

רשתות נוירונים מלאכותיות המיושמות במחשבים פועלות בצורה דומה. רשת נוירונים שמבדילה בין חתולים וכלבים יכולה להיות מורכבת משכבות שבכל אחת מהן מספר שונה של "תאים" מסוגים שונים, שמעבדים בצורות שונות את המידע בתמונה. למשל בשכבה הראשונה יכול להיות תא אחד לכל כמה פיקסלים (נקודות) בתמונה, ואלפי תאים בסך הכול, בשעה שהשכבה האחרונה תכלול תא יחיד שפעולתו מנבאת אם התמונה מציגה חתול או כלב. יש מבנים רבים של רשתות נוירונים, שלכל אחד מהם יתרונות וחסרונות משלו.

אפשר להקביל את הדינמיקה הזו לאפיית עוגה. מתחילים עם כמה מרכיבים, בכל שלב מערבבים אותם, וממשיכים להשתמש בתוצרים של השלבים הקודמים בשלבים הבאים אחריהם. לכל מרכיב יש משקל שונה בכל שלב, כך שלמשל ייתכן שכמות הסוכר בבלילה לא מהותית להכנה, אך חוסר באבקת אפייה עלול להרוס את העוגה. גם כאן ייתכן שנשתמש בחלק מהמרכיבים בכמה שלבים שונים וכל אחד מהם במינון אחר.

ובכל זאת, יש הבדל מהותי בין רשת נוירונים מלאכותית לאפיית עוגה – לעוגה יש מתכון שמגדיר את המינון של כל רכיב ואילו ברשת נוירונים צריך למצוא את המשקלים הנכונים שיניבו ניבויים מדויקים ונאמנים למציאות. התהליך הזה נקרא "אימון", והוא מתרחש כפי שטבח מנוסה מתייחס למתכון חדש – הוא בוחן בקפידה אם צריך להעלות מעט את המינון של מרכיב מסוים התורם לעוגה ולהפחית מרכיב שגורע מטעמה. באופן דומה, כשמאמנים רשת נוירונים, משנים את המשקל שניתן לכל אחד ממרכיביה כדי שתיתן חיזויים כמה שיותר מדויקים על הדוגמאות שלרשותה.

אף על פי שהרעיון של שימוש ברשתות נוירונים ידוע ונחקר כבר עשרות שנים, עד לאחרונה לא נעשה בהן כמעט כל שימוש, בעיקר עקב הקשיים הרבים הטמונים בתהליך האימון. התהליך הזה שקול למצב שבו בתחילת הדרך אין לאופה שום מתכון לשפר, אלא רק אוסף מצרכים וידע מהי העוגה שעליו לאפות. במצב כזה הוא יזדקק לזמן ממושך ויחווה כישלונות מרובים לפני שיצליח לאפות עוגה כלבבו.

באופן דומה, קִטלוג החתולים והכלבים ידרוש מספר רב מאוד של דוגמאות, אחרת ייתכן שהרשת לא תדע להכליל את החיזויים שלה גם לתמונות חדשות, שלא הוצגו לה בזמן האימון. בסופו של דבר ייתכן שאחרי אימון ממושך האופה הדמיוני שלנו יפתח מתכון זהה לגמרי למתכון מוכר של עוגה קיימת. אבל יש אפשרות נוספת – שהוא יבנה לעצמו מתכון משונה אחר, שיניב את העוגה המבוקשת אך אופים מנוסים יתקשו מאוד להבין מדוע מתקבלת עוגה בסופו. באימון רשתות, המקרה השני הוא הנפוץ ביותר. בהיעדר מתכון ראשוני, רשתות הנוירונים נעזרות בלמידת מכונה – שיטות שמאפשרות למחשב לפתח בעצמו את אוסף התבניות (האלגוריתם) הדרושות לפתרון בעיה.

עקב הקשיים הללו בהליך הלמידה, רק בעשור האחרון החל שימוש נרחב באמת ברשתות נוירונים ממוחשבות. להתפתחות הזאת יש כמה סיבות, וביניהן רשת האינטרנט, שהולידה מאגרי נתונים עצומים עשירים בתמונות ובמידע נוסף, והתחזקות כוח החישוב של המחשבים במאה ה-21.

רשתות נוירונים מלאכותיות המיושמות במחשבים מחקות במובנים רבים את רשתות העצבים בגוף. רשת של תאי עצב | מקור: NOBEASTSOFIERCE, Science Photo Library

שימושים

עקב הצלחתן המסחררת במשימות שכלים קודמים כשלו בהן, קשה היום למצוא תעשייה חשובה שאינה משתמשת ברשתות נוירונים. נעזרים בהן לחיזוי שיטפונות, להפעלת כלי רכב אוטונומיים שיודעים לזהות כלי רכב אחרים ומפגעים על הכביש, לקביעת פרמיות ביטוח, לאבחון מחלות ותסמונות ועוד כהנה וכהנה.

אחד השימושים הראשונים ברשתות נוירונים היה לצורך זיהוי ספרות בתמונה. נתנו לרשת תמונה באיכות נמוכה, והניחו לה לקבוע בעצמה מה ההסתברות לכך שמופיעה בה כל אחת מהספרות, מאפס עד תשע. לשם כך היו צריכים להתאים במיוחד למשימה הספציפית הזאת את הארכיטקטורה של הרשת – מבנה החיבורים והתפקוד של כל תא עצב בתוכה. כבר בשנת ה-90 החלו בנקים בארצות הברית להשתמש במערכת כזאת לפענוח הכתב על גבי מיליוני המחאות, וכיום כבר יש מערכות אוטומטיות יעילות מספיק כדי לאשר המחאות ללא מגע יד אדם.

אבן דרך חשובה נוספת בהוכחת היכולות של רשתות נוירונים הושגה בשנת 2016, כשרשת כזאת הביסה את הרב-אומן הקוריאני לי סה-דול במשחק האסטרטגיה היפני גוֹ. אומנם כבר 19 שנה קודם לכן הצליחה מערכת בינה מלאכותית פשוטה יותר לנצח את אלוף העולם דאז בשחמט, גארי קספרוב, אבל מספר המהלכים האפשריים בגוֹ גבוה הרבה יותר מאשר בשחמט ועולה על יכולת החישוב של מערכות מסוגה.

פריצת הדרך הגיעה כשחברת הבינה המלאכותית הבריטית DeepMind פיתחה רשת שמנסה לזהות אם סדרת מהלכים בגוֹ היא כדאית או לא, וכך מאפשרת לפסול מהלכים בצורה הרבה יותר יעילה. כשהתוכנה הצליחה לגבור בזה אחר זה על השחקנים המובילים בעולם, היו מומחים שראו בזה ציון דרך לקראת פיתוח "בינה מלאכותית כללית", שמסוגלת לבצע פעולות אינטליגנטיות מגוונות כמו בני האדם.

ארבע שנים לאחר מכן הגיעה DeepMind לפריצה דרך משמעותית אף יותר, הפעם בתחום הביוכימיה, כשפיתחה מערכת המשלבת כמה רשתות נוירונים, שמנבאת בהצלחה איך יתקפלו חלבונים במרחב. כל חלבון בגוף החי מורכב משרשרת של חומצות אמינו והצורה המרחבית שלו קובעת איך הוא יפעל. למידע הזה יש חשיבות רבה בביולוגיה וברפואה, וכדי לגלות אותו בניסוי צריך להשקיע זמן רב וכסף. המערכת שפותחה מדויקת הרבה יותר מכול שיטה שקדמה לה, ולכן נכנסה מהר מאוד לשימוש במוסדות מחקר ובחברות ביוטכנולוגיה. עם זאת, כיוון שמדובר בניבוי טוב אך לא מושלם, עדיין צריך לפעמים לאשר אותו בניסוי.

מספר המהלכים האפשריים בגוֹ גבוה הרבה יותר מאשר בשחמט, ולכן המשחק הציב אתגר עצום בפני חברות הבינה המלאכותית. לוח גוֹ | מקור: Dilaudid, Wikipedia

מגבלות וסכנות

השימוש המתרחב והולך ברשתות נוירונים מעורר גם חששות לא מעטים. מקור אחד לדאגה הוא אופיה של הטכנולוגיה עצמה, ובמיוחד העובדה שמדובר במעין "קופסה שחורה" אטומה, שנותנת תוצאות שקשה להבין איך הגיעה אליהן. חשש נוסף נוגע לממשק בינה ובין בני האדם, שכן רבים לא מבינים איך נכון להתייחס למערכות בינה מלאכותית מתקדמות, ולמשל נוטים להסתמך עליהן יתר על המידה.

אם מתייחסים לקביעות שהרשתות מפיקות כאילו היו אמת מוחלטת, ולא רק ניבוי עם מידה זו או אחרת של אי-ודאות, פותחים את הדלת לכשלים רציניים. תקלות כאלה קרו למשל במערכת בדיקת ההמחאות, כשהמערכת טעתה והשגיאה לא תוקנה כי לא הייתה שום בקרה אנושית על פעולותיה. רשלנות דומה נצפתה אצל נהגים ברכבי טסלה, שמתוך אמון מופרז במערכת הנהיגה האוטונומית של המכונית לא החזיקו את ידיהם על ההגה בזמן הנסיעה. כשהמערכת כשלה, הם לא הספיקו להגיב בזמן והתרחשה תאונת דרכים.

רשתות הנוירונים הקיימות סובלות מעוד מגבלה חמורה: אחרי שכבר למדו משימה ספציפית, קשה לסגל אותן למשימות חדשות. בשנת 2020 הוצגה לעולם מערכת למידת מכונה בשם GPT-3, שמסוגלת להשלים משפט חלקי למשפט שלם, פסקה, ואפילו כמה פסקאות, ועושה את זה בסגנון אנושי וקוהרנטי.

כדי להגיע ליכולות הללו אימנו את הרשת על מאגר נתונים עצום בנפח של 45 טרה-בייט שנלקח מהאינטרנט. לשם השוואה, כל התוכן של האנציקלופדיה המקוונת ויקיפדיה באנגלית מסתכם בכ-21 גיגה-בייט, פחות מאלפית מנפח המידע שעליו אימנו את הרשת. תהליך האימון הזה עלה כ-12 מיליון דולר, אך היכולות של המערכת מוגבלות. בעיה גדולה אחת היא התיישנות: כיוון שהאימון הוא תהליך חד פעמי, GPT-3 לא מעודכנת בהתפתחויות האחרונות, כששואלים אותה למשל "מי ראש ממשלת בריטניה?" היא תענה "תרזה מיי", אף שבינתיים התחלפו בממלכה שני ראשי ממשלה אחרים. בנוסף, היא כושלת במענה על שאלות פשוטות כמו "כמה זה 45+32?" כי זה לא סוג של טקסט שמרבה להופיע באינטרנט. כך שמדובר ברשת בעלת הישגים יפים, אך מידת ההצלחה שלה תלויה מאוד במטרה שמבקשים להשיג.

רשתות הנוירונים אינן חפות מכשלים, ויש להתייחס אל קביעותיהן במידה של זהירות. נהג ברכב אוטונומי סומך על מערכת הנהיגה | Flystock, Shutterstock

מה מסתתר בקופסה?

אך מעל כל הכשלים הטכנולוגיים והבעיות הנובעות מהטבע האנושי ניצבת בעיית הקופסה השחורה – אי היכולת שלנו לדעת על סמך מה המערכת מקבלת החלטות. אימון של רשת אינו למידה במובן האנושי של המילה, שכן הוא מבוסס רק על מציאת קשרים ויחסים בין פרטים, ולא על הבנה. לכן, כשמאמנים רשת להשיג מטרה זו או אחרת, היא בדרך כלל תבחר בדרך "טיפשה" – למשל לפענח תמונה לפי הרקע במקום לפי האובייקט המצולם עצמו. מאחר שחרקים מצולמים בדרך כלל על עלים או פרחים, הרשת עלולה להגיע למסקנה שכל עצם שמצולם בצמחייה הוא חרק.

בעיה נוספת של הקופסה השחורה עלולה להיות "עצלות". לדוגמה, אימנו רשת לשחק משחק בשם "Coast Runners", שצריך לנווט בו סירת מרוץ לאורך מסלול כדי לצבור נקודות. אך מתברר שהרשת גילתה שהדרך הכי יעילה לצבור נקודות במהירות היא לוותר על צליחת המסלול כולו ובמקום זה לחזור שוב ושוב על תמרון יחיד שמעניק נקודות קלות.

הדוגמה האחרונה נראית תמימה כשמדובר במשחק מחשב, אך היא מצביעה על סכנה ממשית הטמונה במצבים שבהם מטילים על בינה מלאכותית משימות חשובות שיש לבצע רק בדרכים מאוד מסוימות. אם המטרה של מערכת היא להביא כוס מים לשולחן כמה שיותר מהר, ייתכן שהיא תשבור חפצים בדרכה מרוב חיפזון. ואם נגדיר שבירת חפץ ככישלון, אנו עלולים לגלות שכעת המערכת מזיזה את החפצים ממקומם כדי שלא יפריעו לה להתקדם, כך שהכשל עבר למקום אחר. לא חסרים מקרים שבהם הרשת פועלת בדרכים שאיננו מבינים, ולכן איננו מודעים לכשלים שמסתתרים מאחורי התוצאות שהיא מספקת לנו.

עקב צורת הפעולה הלא אנושית שלהן, רשתות נוירונים פגיעות לטעויות שנובעות משינויים זעירים שבני אדם כמעט שלא מסוגלים להבחין בהם. למשל קל למדי לאמן רשת להפיל בפח רשת אחרת – כלומר לעשות שינויים קטנים שיגרמו לרשת המקורית להפיק תוצאות מגוחכות. למשל שינויים מינוריים בגוון של פיקסלים מסוימים בתמונה של כלב עלולים לגרום לרשת שעד כה קטלגה את התמונה היטב לזהות כעת בטעות שמדובר בחתול. אם נחזור לדוגמת המתכון מקודם, זה שקול למצב שבו נותנים לשף גרגיר מלח נוסף ומקבלים עוגה שונה לגמרי.

טעויות כאלה, וטעויות דומות אחרות, מעמידות בסימן שאלה את יכולתנו להסתמך על המערכות הללו, ואת המקום הגדל והולך שאנו נותנים להן בחיינו. ייתכן למשל שמכוניות אוטונומיות יעשו פחות תאונות מנהגים אנושיים, אך כיום אין בידינו כלים מעשיים או חוקיים לוודא שהן בטוחות מספיק. טבען של קופסאות שחורות הוא כזה שבהיעדר מתכון שנוכל לעקוב אחריו שלב אחרי שלב, הליך הבדיקה נהיה הרבה יותר מסובך. כדי להראות שמכונית אוטונומית בטוחה לא פחות מנהג אנושי, נצטרך לבחון אותה נוהגת אלפי שעות ללא תאונה במגוון רחב של נסיבות. מדובר במשימה מפרכת ויקרה, והיא תהיה קשה שבעתיים אם נצטרך לחזור עליה בכל עדכון גרסה.

במשחק CoastRunners גילתה הרשת דרך יעילה אך לא הוגנת לצבור נקודות קלות:

להבין מה המחשב חושב

למה כל כך קשה לנו להבין מה המחשב חושב? אילו היינו יודעים מדוע רשתות הנוירונים מגיעות לתוצאות שאליהן הן מגיעות, ומה הסיבות לטעויות שלהן, יכולנו לוודא די בקלות שהן בטוחות לשימוש, ואף לשכלל אותן עוד יותר. נעשים כיום מאמצים ניכרים לענות על השאלות הללו, מבחינה טכנולוגית וחוקית גם יחד.

ברמת הפיקוח והרגולציה, חסרה כיום בעולם חקיקה עדכנית שתסדיר את השימושים שאנו עושים בבינות מלאכותיות. בבריטניה, למשל, מחפים כיום על היעדר חוקים המתייחסים ישירות לבינה מלאכותית, באמצעות אכיפה של חוקים שנועדו להסדיר את השימוש בטכנולוגיות אחרות. באיחוד האירופי דנים כעת בהצעת חוק להסדרת השימוש בבינה מלאכותית, שנחשבת חקיקה מתקדמת, אך לא חפה מבעיות, כגון התייחסות לא מספקת ליישומים מסוכנים חדשים שעלולים להתגלות. כן יהיו בה הגבלות על יישומים שכרוכים בסכנה לא מקובלת לחברה – למשל מערכת האשראי החברתי הסינית, שהיא מערכת ממשלתית המדרגת את אזרחיה ובהתאם לכך מעניקה להם הטבות ועונשים. הצעת החוק גם מתעלמת מההשלכות שעלולות להיות לשימוש שגוי של משתמשי הקצה במערכות הבינה המלאכותית.

מעבר לצורך המיידי בהסדרה, חוקרים רבים שואפים להבין לעומק, איך רשתות נוירונים עובדות? זהו תחום מחקר פורה אך מורכב להפליא עקב אופי הבעיה. הם חותרים להבין לפרטי פרטים את המתכון של העוגה, ולתאר בצורה יסודית את ההבדלים בחזותם של כלבים וחתולים. אם ימצאו דרך יעילה לעשות את זה, ולו רק במערכות של רשתות נוירונים, ההשלכות יהיו מרחיקות לכת. נוכל לאמן רשתות להתמודד עם בעיות קשות לפתרון, ועל ידי כך לקבל את ה"מתכונים" לפתרונן. ייתכן שהמתכון יהיה מסורבל ולא אלגנטי, אך מתכון ידוע עדיף על פני הקופסה השחורה הלא מפוענחת שיש בידינו כעת.

ייתכן גם שאפשר להסתפק בפחות מהבנה מלאה של המערכות האלה. הרי כשמפתחים תרופה חדשה, הבסיס המדעי להבנת הפעילות שלה כמעט אף פעם אינו מלא. תהליך האישור של תרופות וטיפולים רפואיים חדשים כולל מנגנוני בדיקה יסודיים וניסויים מבוקרים רבים שתפקידם לבחון עד כמה התרופה יעילה ובטוחה לשימוש. עדיין קורות לעיתים הפתעות, אך התהליך הזה מאפשר ליטול תרופות בבטחה.

אפשר לדמיין מצב שבו כל מערכת בינה מלאכותית תידרש לעבור תהליך דומה, אך הסבירות לכך נמוכה. כאמור, רוב המדינות אינן ערוכות כלל לפקח על טכנולוגיות המסתמכות על בינה מלאכותית, וגם קיים חשש ממשי שלהסדרה מופרזת של הנושא תהיה השפעה מרסנת על פיתוחים טכנולוגיים. תהליך העבודה על פיתוח תרופה חדשה נמשך בממוצע יותר מעשר שנים של בדיקות מקיפות. לעיכוב דומה ביישום פיתוחים טכנולוגיים יהיה מחיר כלכלי כבד, וספק אם אפשר בכלל לעמוד בהיקף הבדיקות שיידרש.

ההתמודדות עם הקשיים שמציבה בפנינו ההתקדמות העצומה בתחום הבינה המלאכותית היא אחד האתגרים הגדולים הניצבים בפני האנושות בשנים הקרובות. אנחנו נמצאים כעת בעיצומה של מהפכה שעדיין לא ברור לאן היא תוביל אותנו וכמה זמן היא תימשך. כשאתם אופים עוגה, חישבו כמה טוב שיש לכם מתכון.