כללית הטמיעה מערכת של רד האט לאיגום והתממת מסמכים טקסטואליים
מטרות הפרויקט: טיפול וניתוח מסמכים טקסטואליים, שיפור היעילות בקשר מטפל-מטופל והעשרת המידע עבור אנליסטים ● אור לביא מהכללית הציג את הפרויקט, ששוויו מוערך במיליוני שקלים, בכנס של רד האט
חטיבת מערכות מידע ודיגיטל בשירותי בריאות כללית, בשיתוף אנשי KPMG ישראל, הטמיעו את מערכת אלסטיק על תשתית אופן שיפט של רד האט. מטרות הפרויקט: טיפול וניתוח מסמכים טקסטואליים, שיפור היעילות בקשר בין המטפלים והמטופלים והעשרת המידע עבור אנליסטים. הפרויקט החל ברבעון השני של 2024. השלב הראשון שלו הסתיים ברבעון הראשון של השנה, וכעת הוא נמצא בעיצומו של השלב השני. היקפו לא נמסר לפרסום, אולם גורמים בענף העריכו אותו במיליוני שקלים.
הפרויקט הוצג היום (ב') על ידי אור לביא, ראש תחום פלטפורמת המידע בכללית, בכנס שערך הסניף הישראלי של רד האט באולם האירועים לאגו בראשון לציון, בהפקת אנשים ומחשבים. המוטו של האירוע היה Unlocking Innovation, והשתתפו בו מאות בכירים מלקוחות החברה ושותפיה העסקיים.
צילום ועריכת וידיאו: ליטל רובינשטיין
לביא תיאר את הרקע לביצוע הפרויקט: "יש בכללית מאגרי מידע טקסטואלי רבים, המפוזרים בין מערכות IT שונות ובין מיקומים שונים, מרפאות ובתי חולים. במהלך המפגש מטופל-רופא יש מסמכים טקסטואליים רבים שמכילים מידע בעל ערך רב אך הם לא נגישים לאנליסטים, למדעני הנתונים ולשאר צרכני הדאטה בארגון. מדובר במידע ערכי, המכונה 'רך', שניתן להוסיף אותו כעוד מידע על המטופל. מידע זה לא היה קיים במרוכז, כי הוא הסתתר בתוך הטקסט".
"החלטנו לבנות תשתית שיודעת לאסוף את כל הנתונים הטקסטואליים, להסיר פרטי מידע אישי מזהה, משמע להתמים (מלשון התממה – De-Identification) אותו, להסתיר ולהשמיט פרטים מזהים ממאגר הנתונים, כדי שאלה לא ייחשפו גם לגורמים בתוך הארגון. עשינו זאת על בסיס כמה הנחיות רגולטוריות, ובראשן זו שנוגעת לעולם ארגוני הבריאות, HIPAA (ר"ת Health Insurance Portability and Accountability Act – חוק ניידות ואחריות לביטוחי בריאות)", אמר.
לדברי לביא, "מדובר בעשרות מיליונים של מסמכים רפואיים: סיכומי רופא בקהילה, סיכומי אשפוז במיון, תוצאות בדיקות פתולוגיות ועוד. כלל הנתונים לא היו מאוגדים, אלא פזורים במקומות רבים ובפורמטים שונים. כך, פעלנו בשני כיוונים: איסוף מידע מבוזר והעפת נתונים מזהים. מדובר במידע רפואי מורכב, שלעתים יש בו טעויות כתיב והוא נכתב בסגנונות שונים".
הוא הסביר כי "כיום יש לנו תשתית, שעליה יש מאגר נתונים מותמם, כאשר כל ניהול הדאטה נעשה שם והוא משלב פתרונות AI לתעדוף, סיווג וקטגוריזציה. על תשתית רד האט יושבת הפלטפורמה של אלסטיק, וזו מאפשרת למצוא ולשתף תובנות מהר יותר, לנטר תשתיות לטובת איתור של אנומליות ולהגן על מערכות ונתונים".
השלב השני של הפרויקט
"כעת, בשלב השני של הפרויקט, אנחנו פועלים ליישום פרויקטים אחרים, המבוססים על התשתית שהוקמה. אנחנו מטמיעים עוד אזורי תוכן טקסטואליים, כאשר המטרה היא שרופאים ואנליסטים יקבלו עוד הרבה פרטי מידע – בדגש על שימוש במודולי AI", אמר לביא.
הוא הוסיף שבמסגרת השלב השני, "אנחנו בונים תשתית לטובת מודולי בינה מלאכותית – לדוגמה, תרגומים של מסמכים רפואיים מערבית, מודלים לטובת טיפולים מסוימים ועוד רכיבי שירותים על אופן שיפט".
לסיכום ציין לביא ש-"הפרויקט הביא לקיצור תהליכי הפיתוח של המערכות המטפלות בדאטה טקסטואלי בעשרות אחוזים. בנינו משהו יפה מאפס, עם חשיבה והיערכות קדימה. עכשיו יותר קל לנו 'לטפל' במסמכים – ואנחנו מפיקים מהם יותר תובנות מושכלות. אנחנו בונים תשתית AI היברידית, עם אבטחת מידע והגנת פרטיות, כאשר התשתית מספקת לנו יכולת למנף את הנתונים לטובת ניתוח וקבלת תובנות מושכלות ומתקדמות".











פתרון מדהים