ה-AI הרפואית כבר כאן – אבל עדיין לא מבינה מה היא רואה

הבינה המלאכותית ברפואה צועדת קדימה ומספקת תוצאות מרשימות, אבל בלי "חוזה נתונים" אחיד, גם המודלים המתקדמים ביותר עלולים להיכשל בצורה מסוכנת

דניאל מכניק, המייסד וה-CTO של אאוטברן.

בשנים האחרונות הבינה המלאכותית הרפואית עברה משלב המעבדה לשטח. יישומי AI כבר פועלים בקופות ובבתי חולים, והתוצאות מבטיחות – סיוע לצוותים בקבלת החלטות קליניות, "תרגום" של תוצאות בדיקות לשפה שהמטופל מבין, זיהוי דפוסים חבויים ברשומות רפואיות, ועוד. לאחרונה OpenAI ואנת'רופיק (Anthropic) הצטרפו לטרנד עם ההכרזות על ChatGPT Health ו-Claude for Life Sciences.

ליכולת להפיק תובנות קליניות מתוך כמויות עצומות של מידע יש פוטנציאל ברור, אבל החסם המרכזי אינו היכולות של המודלים, אלא הדאטה עצמו. וזה לא שאין דאטה – להפך, יש המון. אבל הוא מפוזר, לא מובנה, לא נגיש, לעיתים קיים רק כ-PDF ולעיתים משוכפל. מודלים סטטיסטיים לא יודעים מה לעשות עם כל זה ואיזו משמעות לייחס לכל פרט בבליל המידע שהוזן אליהם.

בתחומים כמו AdTech או מנועי המלצות, עמימות בנתונים היא מחיר נסבל. ברפואה, עמימות היא סכנה מוחשית

רשומה רפואית היא לא טבלת SQL מסודרת

רשומה רפואית היא יצור הטרוגני הנבנה לאורך עשורים במערכות שונות בבתי חולים, קופות, מעבדות ומכונים חיצוניים, כשלכל אחת מאותן רשומות דיאלקט משלה. כאשר מודל שפה פועל בתוך ארגון אחד, הוא לומד את מבנה הנתונים שלו. אבל כשהוא נדרש לעבד מידע ממקורות שונים, הוא צריך לנחש את המשמעות כמו גם את הקונטקסט: מה נחשב כ-"אבחנה פעילה" לעומת היסטוריה רפואית?  איך מבדילים בין תצפית (Observation) להערכה קלינית? והאם תרופה X נלקחת על ידי המטופל או שהוא אלרגי אליה?

המודל אולי מזהה בקלות "אבחנה", אבל הוא צריך לנחש אם היא מייצגת מצב רפואי ודאי של המטופל, היסטוריה משפחתית או בכלל אינדיקציה לשלילה ("המטופל אינו סובל מ…").

מודלי שפה סטטיסטיים נוטים להיכשל בדיוק בנקודות האלו. בתחומים כמו AdTech או מנועי המלצות, עמימות בנתונים היא מחיר נסבל. ברפואה, עמימות היא סכנה מוחשית.

צריכה כוונון מדויק. הבינה המלאכותית הרפואית.

צריכה כוונון מדויק. הבינה המלאכותית הרפואית. צילום: ImageFlow, Shutterstock

OpenAPI של עולם הבריאות

כאן נכנס לתמונה חוק ניוד מידע רפואי. החוק מחייב את ארגוני הבריאות בישראל להנגיש את המידע שברשותם למטופל, ולאפשר לו לניידו בין גופים שונים.

מעבר להיבט הצרכני (הזכות של המטופל על המידע שלו), מטרת החוק היא גם לדחוף את המערכת לשפה משותפת. במקום שכל מקור מידע ידבר ב"דיאלקט" משלו, החוק מחייב סטנדרטיזציה באמצעות תקן בינלאומי בשם FHIR® כך שמידע יעבור כגרף נתונים מובנה עם משמעות ברורה.

FHIR הוא לא עוד פורמט JSON למפתחים ולמדעני נתונים, אלא שהוא ה-OpenAPI של עולם הבריאות.

בפועל, מדובר ביצירת חוזה נתונים משותף. בדיוק כפי שתקני OpenAPI בעולם הבנקאות הפתוחה הגדירו מהו "חשבון" ומהי "תנועה" כדי שאפליקציות צד-ג' לא יצטרכו לנחש הקשרים פיננסיים, תקן FHIR מנסה לעשות דבר דומה ברפואה – להגדיר ישויות, הקשרים קליניים ומשמעות, כדי שמכונות יכולות להבין בלי לנחש.

התקן מחלק את המידע הרפואי ל-Resources ומגדיר API מוסכם לביצוע פעולות שונות, אך ההבניה הסמנטית היא הכוח האמיתי שלו. ב-FHIR, לכל שדה בכל Resource יש משמעות מוסכמת, ולרוב נדרש לקודד את הערכים באמצעות קטלוגים סטנדרטיים בינלאומיים כמו SNOMED-CT לאבחנות, או LOINC לבדיקות מעבדה.

בזכות נורמליזציה מובנית זו, המודל לא צריך להסיק בעצמו ש"גלוקוז" במעבדה A ו-GLU במעבדה B הם אותם נתונים, או לנחש באילו יחידות מידה מדובר. המבנה והקידוד הסטנדרטיים לא משאירים מקום לטעויות ולהזיות.

תשתית לפני חוכמה

הפיתוי האופנתי-טכנולוגי הוא לדחוף עוד שכבות של Deep Learning, Prompt Engineering, להזין עוד דאטה גולמי לעוד מנועי LLM וכדומה. אבל ברפואה, הסדר חייב להיות הפוך:

  • מודל נתונים אחיד (Standardization)
  • משמעות קלינית מוגדרת (Terminology)
  • קישוריות רב-מערכתית (Interoperability)
  • AI

מניסיוננו בליווי ארגוני הבריאות בהטמעת החוק, האתגר הגדול הוא לקחת מידע ממערכות שונות (חלקן Legacy) ולעשות בו סדר. לא מדובר במאמץ חד-פעמי, כי מידע ממשיך להיווצר ולהתעדכן באופן שוטף. נדרשת התגייסות של מומחים קליניים ולא רק טכנולוגיים, ביצוע Reverse Engineering למערכות ותיקות ויצירת קישוריות בין נתונים ממערכות שלא דיברו אחת עם השנייה עד כה. כל אסטרטגיית הדאטה והארכיטקטורה דורשות בחינה מחדש.

אנחנו משלבים פתרון טכנולוגי וייעוץ כדי להקל על המהלך המורכב הזה היכן שאפשר, ועדיין מדובר באתגר משמעותי הדורש משאבים רבים כדי להגיע לתוצאות אמינות.

הבינה המלאכותית לא אמורה לפתור בעיות סמנטיקה, היא צריכה לעבוד על סמנטיקה מוגדרת היטב. AI היא המנוע, אבל הנתונים הם הדלק שלה. ללא דלק נקי ואיכותי, המנוע יחנק.

הכותב הוא המייסד וה-CTO של אאוטברן (Outburn)

תגובות

(0)

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אין לשלוח תגובות הכוללות דברי הסתה, דיבה, וסגנון החורג מהטעם הטוב

אירועים קרובים