מגפת הקורונה: לבדוק את הבדיקות

מדוע עלולות להתקבל תוצאות שגויות בבדיקות קורונה? מה עלול לקרות אם נשפר את רגישות הבדיקות ומה אפשר לעשות בכל זאת?

ההתמודדות עם מגפת COVID-19, ועם נגיף הקורונה SARS-CoV-2 הגורם לה, כרוכה בניתוח מידע רב. גופי בריאות וממשלות ברחבי העולם נדרשים לזהות מי חולה, את מי כדאי לבודד, כמה אנשים מדביק חולה ממוצע, מהם שיעורי התמותה מהמחלה, האם מדיניות הריחוק הפיזי פועלת ועוד. איכות המידע מבוססת לעתים קרובות על אמינותן של בדיקות המעבדה — אם התוצאות שהן מניבות שגויות, או שמגבלותיהן לא נלקחות בחשבון, אנו עלולים לקבל החלטות לא מיטביות.

אם לא נערוך מספיק בדיקות, אנו עלולים למצוא את עצמנו עם מידע חלקי או מוטה – למשל לפספס חלק ניכר מהחולים שמצבם קל ולכן לקבל נתונים מסולפים על שיעורי ההדבקה והתמותה. אך האם אפשר לבצע יותר מדי בדיקות? כדי לענות על השאלה הזאת עלינו להבין את המשמעות של שגיאות הבדיקה.

אף אחד לא מושלם

בדיקת המעבדה למחלת הקורונה נדרשת כדי לאבחן מי חולה ומי בריא. בעולם אידיאלי, כל מי שחולה היה מקבל תוצאה חיובית, וכל מי שבריא תוצאה שלילית. אך המציאות תמיד מורכבת יותר, ולמרות כל המאמצים בדיקות מעבדה אינן מושלמות: נבדק חולה עלול להימצא בריא (תוצאה שלילית כוזבת), למשל בגלל בעיה בלקיחת הדגימה או בהובלתה למעבדה; ונבדק בריא עלול להימצא חולה (תוצאה חיובית כוזבת), למשל בגלל זיהום הדגימה.

תמיד ייתכנו טעויות. התוצאות האפשריות בבדיקה בינארית לאבחון של מחלה | איור: יובל רוזנברג

גורמים רבים עלולים להוביל לתוצאה כוזבת, והם משתנים מבדיקה לבדיקה. למחלת COVID-19 יש שני סוגים עיקריים של בדיקות מעבדה, ולכל אחת מורכבות משלה. הבדיקה המולקולרית, שהיא השיטה העיקרית שבה משתמשים כיום, מזהה באופן מדויק וספציפי מאוד אם יש נגיפי קורונה בדגימה, אבל דרך לקיחת הדגימה, המבוססת לרוב על גירוד של ריריות הפה והאף בעזרת מטושים, עלולה להוביל לטעויות רבות. בנוסף, הבדיקה לא מזהה חולים שזה עתה נדבקו, והרגישות שלה מושפעת מאוד מהבדלים במאפייני החולים, שיטת הדגימה ושלבי המחלה.

סוג שני של בדיקה הוא הבדיקה הסרולוגית, שנעשית על ידי על דגימת דם ומבוססת על זיהוי הנוגדנים שהגוף מייצר נגד הנגיף, שנשארים בגוף גם לאחר ההחלמה. בדיקת דם נחשבת אמינה יותר מדגימה עם מטוש, וחברות רבות שוקדות על פיתוח בדיקת נוגדנים זולה ופשוטה לשימוש המוני. נכון להיום עדיין אין בידינו בדיקת נוגדנים מדויקת מספיק שאפשר להסתמך עליה בלבד, אך היא מומלצת לסיוע באבחון בשילוב עם בדיקה מולקולרית ואבחון קליני על בסיס תסמיני המחלה.

הטבלה לא משקרת

מידת הרגישות של בדיקה מוגדרת על פי יכולתה לזהות נכון את החולים, כלומר כשנבדק אכן חולה, מה ההסתברות לתוצאה חיובית. מדד חשוב נוסף לאיכות הבדיקה הוא מידת הסגוליות (ספציפיות) שלה, כלומר ההסתברות לקבלת תוצאה שלילית אצל נבדק בריא. דיוק הבדיקה תלוי בשני המדדים. בדיקה שתוצאתה תמיד חיובית, ולא מבחינה בין חולה לבריא, תציג 100 אחוז רגישות ו-0 אחוז סגוליות. בדיקה שתוצאתה תמיד שלילית, תציג 0 אחוז רגישות 100 ו- אחוז סגוליות. לעתים שני המדדים מתנגשים, כך שהצורך להגביר את רגישות הבדיקה פוגע בסגוליות שלה, ולהפך.

אפשר להמחיש את הדילמה הזאת על פי דוגמה מעולם האבטחה: גלאי מתכות, למשל כאלה שמוצבים בכניסה לקניונים, בודקים אם אדם נושא חפץ מתכתי. אם נכוון את הגלאי לרגישות גבוהה כדי לוודא שלא פספסנו סכין או מטען חבלה, הגלאי יצפצף גם בתגובה לרוכסן מתכת או אבזם של חגורה. הרגישות הגבוהה מובילה להתרעות שווא רבות, כך שהסגוליות שלו נמוכה. באופן דומה, הפחתת הרגישות של הגלאי תגדיל את הסגוליות שלו, אך עלולה לאפשר למחבל חמוש להיכנס לקניון.

הרגישות והסגוליות הן תכונות שקשורות לבדיקה עצמה, ולא תלויות בשכיחות המחלה באוכלוסיית הנבדקים. כדי לאמוד אותן צריך לעשות בדיקות לכמה שיותר אנשים מאוכלוסיות מגוונות ולאמת את התוצאות מול שיטות בדיקה אחרות שמאפשרות לאבחן את המחלה בוודאות גבוהה. טבלה מסכמת של הממצאים (Confusion matrix) מאפשרת לחשב את המאפיינים הסטטיסטיים של הבדיקה. טבלאות דומות משמשות גם לאפיון בדיקות בינאריות שאינן רפואיות, כמו אלגוריתמים של בינה מלאכותית המסווגים מידע לשתי קטגוריות – למשל האם בתמונה מסוימת מופיע חתול או לא. נכון להיום קיימת אי-ודאות רבה בנוגע לרגישות ולסגוליות של שני סוגי הבדיקות לקורונה, הסרולוגיות והמולקולריות. בנוסף, יש מגוון דרכים לבצע את שני סוגי הבדיקות, ולכל דרך ביצוע רגישות וסגוליות משלה.

תוצאות כוזבות

למרות ששיעור החולים באוכלוסייה לא משפיע על רגישות הבדיקה והסגוליות שלה, יש לו השפעה רבה על מספר התוצאות הכוזבות, ולכן הוא עלול ליצור רושם מוטעה לגבי שכיחות המחלה. שיעור נמוך מאוד של חולים באוכלוסייה עלול להוביל לתוצאות כוזבות רבות. כדי להבין מדוע, ננתח שתי בדיקות דמיוניות. החישובים הדרושים אינם מורכבים, ואפשר להיעזר במחשבון ייעודי כדי להבין איך שינוי בנתונים עלול להשפיע על תוצאות הבדיקות בפועל.

תוצאות האפשריות בבדיקה בינארית לאבחון של מחלה | איור: יובל רוזנברג
תוצאות הבדיקה תלויות במאפייניה הסטטיסטיים ובשכיחות המחלה (הצבעים תואמים לטבלת התוצאות למעלה) | איור: יובל רוזנברג

נניח לצורך העניין שהרגישות של בדיקה מסוימת היא 92 אחוז והסגוליות שלה 96 אחוז. אם נבדוק רק אנשים שמראים תסמינים מסוימים, או שבאו במגע עם חולה מאומת, שיעור החולים מכלל הנבדקים יהיה גבוה יחסית – למשל 40 אחוז. במקרה כזה, מתוך 100 נבדקים (40 חולים ו-60 בריאים), נקבל 39 תוצאות חיוביות (0.92 כפול 40 חולים - חיובי אמיתי, ועוד 0.04 כפול 60 בריאים חיובי כוזב), ו-61 שליליות (0.08 כפול 40 חולים - שלילי כוזב ועוד 0.96 כפול 60 בריאים שלילי אמיתי) – מצב קרוב מאוד למצב האמיתי של החולים באוכלוסייה שנבדקה. עם זאת, שני נבדקים בריאים מתוך המאה יקבלו תוצאה חיובית כוזבת ויאובחנו בטעות כחולים, ושלושה נבדקים חולים יקבלו תוצאה שלילית כוזבת ויאובחנו בטעות כבריאים.

עכשיו נניח שאנחנו בודקים מדגם מייצג של האוכלוסייה כולה: במצב שבו אחוז אחד מהציבור חולה (מצב חמור בהרבה מאחוז החולים המאומתים בישראל נכון למאי 2020) כמעט כל החולים יזוהו, אך מרבית התוצאות החיובית (יותר מ-80 אחוז מהן) יתקבלו עבור אנשים בריאים. הסיבה לכך היא שמאחר שכמעט כל הנבדקים הם בריאים, גם סיכוי נמוך לתוצאה חיובית כוזבת יוביל להתרעות שווא רבות. אם הרוב המכריע בריא, גם אחוז קטן ממנו עלול להיות מספר גדול משמעותית ממספר החולים האמיתיים.

בדיקה אחרת שננתח היא "בדיקת החלומות". נניח עבורה 99 אחוזי רגישות ו-99 אחוזי סגוליות. גופים רבים עמלים לפתח בדיקת קורונה בעלת דיוק כזה לפחות, לצורך ביצוע בדיקות סקר נרחבות. במקרה כזה, אם 40 אחוז מהציבור חולה נקבל רק אחוז בודד של תוצאות כוזבות, בעיקר חיוביות, והבדיקה תהיה אמינה מאוד. גם במצב שבו רק אחוז אחד מהאוכלוסייה חולה נקבל רק אחוז יחיד של תוצאות כוזבות, כמעט כולן חיוביות, אך תוצאות הבדיקה יהיו מטעות: במצב הזה מחצית מהתוצאות החיוביות יהיו שגויות ואנשים בריאים יאובחנו כחולים.

לא לקבל כל תוצאה כנכונה. ערכת לבדיקת קורונה | צילום: danielmarin, Shutterstock

קיבלתי תוצאה חיובית. האם אני חולה?

כל עוד סגוליות הבדיקה אינה קרובה מאוד ל-100%, ושיעור החולים באוכלוסייה הנבדקת נמוך, חלק ניכר מהתוצאות החיוביות יהיו כוזבות. אדם שנבדק ונמצא חיובי יכול לחשב את הסיכוי שהוא חולה (ערך הניבוי החיובי) בעזרת הסתברות מותנית: בהינתן סגוליות הבדיקה ושיעור החולים באוכלוסיה, מה הסיכוי שתוצאה חיובית היא אמיתית? באופן מתמטי, זה המספר היחסי של תוצאות האמת מתוך סך התוצאות החיוביות.

כפי שראינו, ככל ששיעור החולים בפועל נמוך יותר, גדל הסיכוי שאדם בריא יאובחן בטעות כחולה. זאת החולשה הגדולה של בדיקות סקר שנעשות על ציבור גדול והטרוגני – הן מניבות כמות גדולה מאוד של אבחונים חיוביים כוזבים עקב כך שרוב האוכלוסייה בריאה. ומנגד, אם נתמקד בבדיקת אנשים שיש מלכתחילה חשש שהם חולים, אנו עלולים לפספס חולים שלא הציגו תסמינים, ובנוסף, אחוזי החולים מתוך סך הנבדקים לא ישקפו את אחוזי התחלואה האמיתיים באוכלוסייה.

קיבלתי תוצאה שלילית. האם אני בריא?

באופן דומה, אפשר לחשב בעזרת הסתברות מותנית את הסיכוי שאדם שקיבל תוצאה שלילית הוא אכן בריא (ערך הניבוי השלילי). לכל הדוגמאות שהצגנו יש יכולת ניבוי שלילי גבוהה. הסיבה היא שבכולן רוב הנבדקים הם בריאים, והסגוליות היא גבוהה.

הרגישות של בדיקת הקורונה המולקולרית, שעליה הסתמכו ארגוני הבריאות עד כה, מוגבלת ועומדת לפי הערכות ראשוניות על פחות מ-80 אחוז. בשל הסיכון הכרוך בתוצאה שלילית כוזבת, שתאפשר לאדם חולה לצאת מבידוד ולהדביק אחרים, מבצעים שתי בדיקות במועדים שונים, ורק אם שתיהן מניבות תוצאה שלילית - דבר שמקטין את הסיכוי שהתוצאה השלילית היא כוזבת, מניחים שהחולה באמת בריא. אילו רגישות הבדיקה הייתה מושלמת, יכולנו להסתפק בממצא שלילי אחד, בהנחה שלקיחת הדגימה מושלמת גם היא.

אפשר להשלים את תוצאות הבדיקות עם מידע נוסף. ערכה לבדיקה מולקולרית (PCR) | צילום: WLADIMIR BULGAR / SCIENCE PHOTO LIBRARY

דרוש מידע נוסף

כל עוד לא יהיו לנו בדיקות מעבדה עם סגוליות כמעט מושלמת, בדיקות סקר על האוכלוסייה הכללית לבדן צפויות אם כן להניב הערכות עודף משמעותיות בנוגע לכמות החולים. מצד שני, מאחר שחשוב מאוד למנוע את האפשרות שנחמיץ חולים אמיתיים, דורשים מהבדיקות רגישות כמה שיותר גבוהה ומתייחסים ברצינות לכל אבחון חיובי. התופעה הזאת אינה ייחודית לבדיקות הקורונה, אלא רלוונטית לבדיקות סקר רבות: החל בבדיקות לגילוי מוקדם של סרטן, וכלה בתבחין לזיהוי הדבקה בשחפת.

התועלת של כל בדיקת סקר נבדקת שוב ושוב, שכן בדיקות כאלה מצילות חיי אדם, אך עלולות גם לגרום נזק עקב אבחון שגוי שיוביל לטיפול רפואי במחלה לא קיימת. גם אבחון יתר של מחלה אמיתית הוא בעייתי, משום שהוא עלול להוביל למשל לטיפול יתר: טיפול במחלה גם עבור מקרים בהם היא איננה מסכנת את החולה. במקרה כזה האבחון והטיפול עלולים להסב יותר נזק מתועלת.

כדי להתגבר על הבעיה ולקבל תמונה אמינה של המציאות גם כשמרבית הנבדקים בריאים, יש לאפיין בקפידה את בדיקות המעבדה ולבצע בדיקות נוספות: אפשר למשל לבדוק אם הופיעו תסמינים של המחלה, להעזר בתחקיר אפידמיולוגי למציאת מקורות הדבקה אפשריים או לעשות בדיקה חוזרת למי שקיבלו תוצאה חיובית. אם נחזור לדוגמת גלאי המתכות בקניון, במקרה שהוא מצפצף אפשר לעשות לאדם חיפוש גופני, לתשאל אותו או לבקש שיעבור שוב במכונה. לא נעצור אדם רק משום שהוא גרם לגלאי לצפצף. כמו כן, אם במקום להסתפק בתשובה בינארית — חיובי או שלילי — הבדיקה תספק תשובה כמותית, כמו כמות הנגיפים או ריכוז הנוגדנים, נוכל לסווג חלק מהתוצאות כגבוליות ולהתייחס אליהן בתשומת לב יתרה.

ייעוץ מדעי לכתבה: ד"ר נורית רוזנברג, מנהלת המעבדה לקרישת הדם במרכז הרפואי שיבא ומרצה במכללת אחווה.