כדי למנוע מן הרשת לקרוס תחת כובד משקלם של הנתונים ההולכים ומצטברים, יש לשנות באופן יסודי את האופן שבו היא מטפלת במידע – כך טוען מנהל מעבדות בֶּל למחקר

בקיצור

  • מי: מרקוס הופמן
  • עיסוק: מדען ומהנדס מחשבים
  • היכן: מעבדות בֶּל למחקר, הולמדל, ניו ג'רזי
  • מוקד המחקר: האם רשתות תקשורת חכמות יסייעו לאינטרנט להתגבר  על כאבי הגדילה שלו?
  • ההֶקשר: האינטרנט והתשתית שלו חייבים להתאים את עצמם לתעבורת  הנתונים הכבדה שמפיקים התקנים ניידים ותכני מולטימדיה.

עד סוף 2013 יעלה מספר הסמארטפונים, הטאבלטים והגאדג'טים האחרים המחוברים לאינטרנט על מספרם של בני האדם. אבל מה שחשוב אפילו יותר, אולי, הוא שההֶתקנים המהירים והחזקים הנכנסים היום לשוק מפיקים וצורכים תוכן בכמויות חסרות תקדים. על פי דוח עדכני של חברת סיסקו, המייצרת חלק ניכר מן הציוד שמפעיל את האינטרנט, כמות הנתונים ה"ניידים" ברחבי העולם גדלה ב-70% ב-2012. עם זאת, קיבולת תשתית הרישות העולמית היא סופית, ורבים תוהים מתי נגיע לגבול העליון, ומה נעשה כשזה יקרה.

יש כמובן דרכים להגדיל את הקיבולת, כגון הוספה של כבלים, הוספה של סיבים אופטיים ופריקה של תעבורה לרשתות-לוויין קטנות יותר, אך צעדים כאלה רק דוחים את הקץ הבלתי-נמנע. הפתרון הוא להפוך את התשתית הכוללת לחכמה יותר. לשם כך יש צורך בשני מרכיבים: מחשבים והתקנים אחרים שיכולים לבצע עיבוד מוקדם, ואולי אף לסנן או לארגן את התוכן לפני שהם משליכים אותו אל הרשת, ורשת שמבינה טוב יותר מה לעשות עם התוכן הזה, במקום לתפוס אותו ללא הבחנה כזרם אינסופי, לא ממוין, של סיביות ובתים.

כדי לברר כיצד יהיה אפשר לממש את המרכיבים המתקדמים האלה, ריאיין סיינטיפיק אמריקן את מרקוס הופמן, מנהל מעבדות בֶּל למחקר בהוֹלְמְדֶל שבניו ג'רסי, זרוע המחקר והפיתוח של אַלקַטֶל-לוּסֶנט שהתפרסמה, בגלגוליה השונים, בזכות פיתוח הטרנזיסטור, הלייזר, ההתקן  צְמוּד-המִטְעָן (CCD) ומבחר טכנולוגיות פורצות דרך אחרות במאה ה-20. הופמן, שהצטרף למעבדות בל ב-1998 לאחר שקיבל את הדוקטורט שלו מאוניברסיטת קרלסרוהה שבגרמניה, ואנשי צוותו רואים ב"רישות מידע" את הדרך לעתיד – גישה שתאפשר להגדיל את קיבולת האינטרנט באמצעות העלאת "מנת המשכל" של הרשת. הנה קטעים מן הריאיון.

תמונת מרקוס הופמן עטוף בחוטי חשמל. קרדיט: דייוויד ילן | Scientific American
 צילום: דייוויד ילן

סיינטיפיק אמריקן: כיצד נוכל לדעת שאנחנו מתקרבים לקצה גבול היכולת של תשתית התקשורת הנוכחית?

הופמן: הסימנים אינם בולטים, אך הם קיימים. הנה דוגמה אישית: כשאני משתמש בסְקַייפ כדי להראות בשידור חי להוריי בגרמניה את ילדיי משחקים הוקי, לעתים הסרט קופא ברגעים המרגשים ביותר. זה לא קורה לעתים קרובות מאוד, אך לאחרונה זה קורה יותר ויותר – סימן לכך שהרשתות מתחילות לכרוע תחת כמויות המידע שהן נדרשות לשאת.

אנחנו יודעים שהטבע מציב לנו גבולות. יש כמות מוגבלת של מידע שאפשר להעביר בערוצי תקשורת מסוימים. תופעה זו מכונה בשם "גבול שאנון הלא-לינארי" [על שם המתמטיקאי קלוד שאנון שעבד במעבדות בל לטלפוניה], והיא אומרת לנו עד היכן נוכל להתקדם עם הטכנולוגיות שבידינו. אנחנו כבר קרובים מאוד לגבול הזה, בסדר גודל של פי שניים לערך. במילים אחרות, כשנכפיל את נפח התעבורה הנוכחית ברשת,  וזה דבר שיכול לקרות בארבע או בחמש השנים הבאות, נגיע לגבול שאנון. יש לנו כאן  אפוא מחסום עקרוני. את הגבול הזה לא נוכל למתוח בשום דרך, בדיוק כפי שאיננו יכולים להגדיל את מהירות האור. לכן, עלינו לעבוד במסגרת הגבולות האלה ועדיין למצוא דרכים להמשיך את הצמיחה הדרושה.

איך מונעים מן האינטרנט להגיע עד קצה הגבול הזה?

הדרך הברורה מאליה היא להגדיל את רוחב הפס באמצעות הוספת כבלי סיבים אופטיים. לדוגמה, במקום כבל טרנס-אטלנטי יחיד של סיבים אופטיים, אפשר להניח שני כבלים, או חמישה או עשרה כבלים. זוהי גישת הכוח הגולמי, והיא יקרה מאוד: צריך לחפור ולהניח את הכבל, יש צורך בהרבה מגברים, משדרים ומקלטים אופטיים, וכן הלאה. כדי שיהיה הדבר מעשי מבחינה כלכלית, נצטרך לא רק  לאחד ערוצים מרובים בכבל אופטי יחיד, אלא גם לשלב משדרים ומקלטים מרובים בעזרת טכנולוגיות חדשות, כגון אינטגרציה פוטונית. גישה זו מכונה בשם ריבוב בחלוקה מרחבית.

אבל גם כך, לא יהיה די בתגבור התשתית הקיימת כדי לעמוד בדרישות התקשורת הגוברות. מה שנדרש הוא תשתית שתתפוס את הנתונים הגולמיים באופן שונה: לא רק כרצף של סיביות ובתים, אלא כפיסות מידע שרלוונטיות לאדם מסוים שמשתמש במחשב או בסמארטפון. האם, ביום מסוים, תרצו לדעת את הטמפרטורה, מהירות הרוח ולחץ האוויר, או שפשוט תרצו לדעת איך להתלבש? הדבר קרוי רישות מידע.

מה הופך את "רישות המידע" לשונה מן האינטרנט של ימינו?

רבים רואים באינטרנט רשת "טיפשה", מונח שאינו מקובל עלי. מה שהניע את האינטרנט בראשית הדרך היה שיתוף של מסמכים ושל נתונים שלא בזמן אמת. הדרישה העיקרית מן המערכת הייתה כושר התאוששות: היא הייתה אמורה להמשיך לפעול גם אם צומת אחד או יותר בה [מחשבים, שרתים וכדומה] חדלו לתפקד. יותר מזה, הרשת תוכננה לראות בנתונים תעבורה דיגיטלית בלבד, ולא לפרש את משמעות הנתונים האלה.

כיום אנחנו משתמשים באינטנרט בדרכים שמצריכות ביצועים בזמן אמת, בצפייה בשידור וידאו חי או בשיחות טלפון, למשל. במקביל, אנחנו גם מייצרים הרבה יותר נתונים. הרשת חייבת להיות מודעת יותר למידע שהיא מעבירה, כדי שתוכל לתעדף היטב את ההעברה ולפעול ביעילות. לדוגמה, אם אני משתתף בוועידת וידאו במשרד שלי ומפנה את ראשי הצידה כדי לדבר עם מישהו שנכנס למשרד, מנגנון הוועידה צריך לדעת להפסיק לשדר וידאו עד שתשומת לבי תחזור למסך. המערכת תזהה שאיני מפנה את תשומת לבי לוועידה ולא תבזבז רוחב פס בזמן כשאני מדבר עם האדם שנכנס למשרד זה עתה.

איך הופכים את הרשת למודעת יותר למידע שהיא נושאת?

רווחות גישות שונות לכך. אם רוצים לדעת יותר על הנתונים שעוברים ברשת, לדוגמה, כדי לשלוח בקשת משתמש אל שרת הרשת הקרוב ביותר כדי לצפות בדף אינטרנט, יהיה צורך להשתמש בתוכנה ש"מציצה" לתוך מנת הנתונים, מה שמכונה בשם "בדיקה מעמיקה של מנות". חשבו על מכתב שאתם שולחים בדואר רגיל בתוך מעטפה שעליה רשומה כתובת. לשירות הדואר לא אכפת מה כתוב במכתב: הוא מעוניין רק בכתובת. כך האינטרנט פועל כיום ביחס לנתונים. בבדיקה מעמיקה של מנות נתונים, התוכנה מורה לרשת לפתוח את מעטפת הנתונים ולקרוא לפחות חלק מן התוכן. עם זאת, יש רק כמות מוגבלת של מידע שאפשר לגלות על הנתונים בשיטה כזאת, והיא מחייבת כוח עיבוד רב. כמו כן, אם הנתונים שבמנה מוצפנים, הבדיקה המעמיקה לא תפעל.

אפשרות טובה יותר היא לתייג נתונים ולתת לרשת הוראות לטיפול בסוגי נתונים שונים. יכולה להיות, למשל, מדיניות שלפיה נתוני וידאו יקבלו עדיפות על פני דואר אלקטרוני, אם כי אין צורך לגלות מה בדיוק יש בווידאו או בדואר האלקטרוני. הרשת פשוט מביאה בחשבון את תגי הנתונים האלה בעת קבלת החלטות ניתוב.

לנתונים שמועברים באינטרנט כבר יש תגים מזהים. למה אי אפשר להשתמש בהם?

הכול תלוי ברמה שבה משתמשים בתגים. לדוגמה, מנות נתונים שמשתמשות בפרוטוקול אינטרנט כוללות כותרת, ובה כתובת המקור וכתובת היעד. אפשר לחשוב עליהן כעל תגים, אך המידע שהן מספקות מוגבל מאוד. הן אינן מציינות איזה אתר אינטרנט המשתמש מבקש, ואף אינן אומרות האם הנתונים שייכים לשידור וידאו חי או שאפשר לעבד אותו באצוות. אני מדבר על תגים עשירים, ברמה גבוהה יותר, או על מֵטָא-נתונים שניתנים למיפוי חלקי טוב יותר מן המיפוי שאפשר לבצע באמצעות התגים ברמה הנמוכה יותר.

האם תִעדוּף של תעבורה בהתבסס על המידע שהיא מכילה לא יגרום לרשת להעדיף תוכן מסוים על חשבון תוכן אחר?

זה לא יהיה שונה ממה שאנחנו רואים כבר כיום: לדוגמה, כשאנחנו נוסעים בכביש ושומעים רכב חירום מתקרב עם סירנות פועלות. במקרה כזה, אנחנו אמורים להיצמד לצד ולפנות לו את הדרך כדי שיוכל לעבור באופן המהיר והנוח ביותר, ואולי להציל חיי אדם. בדוגמה זו, הסירנה היא התג. כל עוד אנחנו מודעים לכך שיש מצב חירום, איננו צריכים לדעת מי מצוי ברכב או מה הבעיה, ואנחנו מתנהגים בהתאם. האם עלינו להעניק למנות נתונים מסוימות באינטרנט קדימות במקרה חירום? זוהי שאלה של שקיפות ושל התנהגות מוסכמת, בכבישים וגם ברשת.

אפילו אם הרשת המשופרת תוכל להעביר נתונים בדרך חכמה יותר, כמות התוכן תמשיך לגדול באופן מעריכי. כיצד תפחית את כמות התעבורה שהרשת נדרשת לטפל בה?

הסמארטפונים, המחשבים והגאדג'טים האחרים שלנו מפיקים כמות גדולה של נתונים גולמיים, שנשלחים למרכזי נתונים לצורך עיבוד ואחסון. בעתיד, לא יהיה אפשר לטפל בכל הנתונים על פני הגלובוס על ידי שליחתם למרכז נתונים ריכוזי אחד לצורך עיבוד. במקום זאת, ייתכן שנעבור למודל שבו החלטות מתקבלות בנוגע לנתונים לפני שהם מועלים לרשת. למשל, אם יש לנו מצלמת בטיחות בשדה תעופה, נתכנת אותה, או נתכנת מחשב שרת קטן ששולט בכמה מצלמות, לבצע זיהוי פנים בו במקום, בהתבסס על מסד נתונים שמאוחסן במצלמה או בשרת, לפני העלאת מידע כלשהו לרשת.

איך רישות המידע מטפל בנושא הפרטיות?

כיום, הפרטיות היא בינארית: או ששומרים על פרטיות או שמוותרים עליה כמעט לגמרי כדי לקבל שירותים בהתאמה אישית, כגון המלצות מוזיקליות או קופונים מקוונים. עלינו למצוא מודל ביניים, שיאפשר למשתמשים שליטה במידע שלהם.

הבעיה הגדולה ביותר היא שמודל כזה חייב להיות פשוט מבחינת המשתמש. חשבו עד כמה מסובך לנהל את הפרטיות ברשתות חברתיות: בסופו של דבר אתם מוצאים את התמונות שלכם באלבומים המקוונים של אנשים שאינכם מכירים כלל. צריכה להיות מקבילה דיגיטלית לידית של ברז, שיהיה אפשר לסובב כדי לקבוע את האיזון בין פרטיות להתאמה אישית. ככל שנגלה יותר על עצמנו, השירותים שנקבל יהיו מותאמים לנו. אך נוכל לסובב את הידית גם בכיוון ההפוך, אם נרצה לספק מידע פחות מפורט, ועדיין נוכל לקבל הצעות בהתאמה אישית, אם כי פחות ממוקדות.

התקפות סייבר נוטות לנצל את הפתיחות של האינטרנט, והטיפול באבטחה מועבר בסופו של דבר למחשבים ולהתקנים אחרים שמחוברים לרשת. איזו השפעה תהיה לרישות המידע על אבטחת האינטרנט?

גישת רישות המידע מעניקה לתשתית האינטרנט בכללותה מודעות גדולה יותר לתעבורת הרשת, והדבר עשוי להיות לעזר בזיהוי ובנטרול סוגים מסוימים של התקפות סייבר. גורמים אחרים עשויים גם הם לשבש התקפות כאלה. אני מצפה – ומקווה – שתעבורת הנתונים תיעשה יותר ויותר מוצפנת, כדי לסייע בהשגת אבטחה אמיתית ופרטיות אמיתית. כמובן, מרגע שהנתונים מוצפנים, קשה לחלץ מהם מידע כלשהו. זהו אתגר מחקרי שיצריך שיטות הצפנה חדשות, כאלה שישמרו על הסודיות ועדיין יאפשרו פעולות מתמטיות מסוימות על המידע המוצפן.

תארו לעצמכם, למשל, שנתוני ההכנסה של כל בית אב באזור מסוים מוצפנים ומאוחסנים על שרת בענן, כך שאיש חוץ מן הבעלים המורשים של המידע אינו יכול לקרוא את המספרים האמיתיים. אם יהיו המספרים מוצפנים באופן שיאפשר לתוכנה שרצה בענן לחשב את ההכנסה הממוצעת באזור, בלי לזהות אף לא אחד מבתי האב, אלא פשוט באמצעות פעולות על המספרים המוצפנים, הדבר יוכל להביא תועלת רבה.

גישה נוספת עשויה להיות פיתוחן של דרכים חכמות לניהול מפתחות הצפנה באופן שיאפשר שיתוף בלי לסכן את האבטחה. אם ייעשה הדבר כהלכה, שום צעד מן הצעדים האלה לא יכביד על המשתמשים. זהו המפתח להצלחה והאתגר העומד לפנינו. חשבו, למשל, כמה מן המשתמשים מצפינים את הדואר האלקטרוני שלהם כיום: כמעט אין איש עושה זאת, משום שהדבר מחייב השקעה של זמן ושל עבודה.


לקריאה נוספת

 

0 תגובות