יום הזיכרון לשואה ולגבורה תשפ''ב

ה-AI מסייע לגלות מה אירע לאלפי קורבנות נאצים שגורלם לא נודע

הבינה המלאכותית החדשנית, שפותחה על ידי ענקית הטכנולוגיה אקסנצ'ר ומכון ארולסן, כבר איתרה מידע אודות 160 אלף קורבנות שואה שעד לא היה ידוע מה עלה בגורלם

הבינה המלאכותית מפענחת מסמכי נאצים היסטוריים.

צוות מתנדבים מחברת אקסנצ'ר (Accenture) בנה פתרון מבוסס בינה מלאכותית, שעוזר לחלץ מידע על קורבנות רדיפות הנאצים ממסמכי ארכיון ארולסן (Arolsen Archives), ארכיון מסמכי הנאצים הגדול בעולם.

הפתרון החדש מהיר פי 40 מכל פתרון שהיה מוכר עד היום ועד כה אותרו באמצעותו למעלה מ-160 אלף קורבנות, ששמותיהם נוספו לארכיון. מכון ארולסן קורא לעזרת הציבור לסייע במלאכת האיתור במטרה לשפוך אור על גורלם של אלפי קורבנות נאצים שגורלם לא נודע.

צוות מומחי ה-AI המובילים מענקית הייעוץ הטכנולוגית אקסנצ'ר חבר יחדיו כדי לייצר בהתנדבות פתרון מבוסס בינה מלאכותית עבור ארכיון מכון ארולסן בגרמניה, המסייע לחלץ מידע אודות קורבנות רדיפות הנאצים ממסמכי הארכיון במהירות של פי 40 מהמאמצים הקודמים שנעשו בתחום.

ארכיון ארולסן משמר את האוסף הגדול בעולם של מסמכים המתעדים את רדיפות הנאצים – מעל 110 מיליון מסמכים וחפצים דיגיטליים, שחלקם משתייכים לתוכנית "זיכרון העולם" של אונסק"ו, יוזמה בינלאומית אשר מטרתה לשמור על המורשת התיעודית של האנושות כנגד השמדה. חלק מהותי בעבודת הארכיון הוא להנגיש את המסמכים הללו לכל המבקשים לחפש מה עלה בגורלם של קורבנות וניצולי שואה.

איתור נפגעי הנאצים

עם תום מלחמת העולם השנייה בעלות הברית הקימו שירות איתור בינלאומי לנפגעי הנאצים בעיירה באד ארולסן שבגרמניה. במרוצת השנים שירות האיתור הפך למכון מחקר שנושא את שם העיירה ארולסן, ועיקר פעילותו מתמקדת בתיעוד פשעי הנאצים באמצעות הארכיון העצום של מסמכים שהיו שייכים לנאצים. הארכיון מכיל את האוסף הגדול ביותר של מידע על קורבנות נאצים, כולל מסמכים על מחנות ריכוז, עבודת כפייה ועקורים. 

במאמץ להפוך את חיפוש המידע לנגיש ככל האפשר, החלו בארולסן לפני מספר שנים בתהליך דיגיטציה של כל המסמכים ופרסומם באופן מקוון כחלק מפרויקט everynamecounts#. היות שמדובר במסמכים ישנים, שחלקם הועלו באופן שאינו בר חיפוש (למשל כתמונה) וחלקם נפגמו, הרי שנדרשת עין אנושית לטובת תרגום, קריאה, תמלול, קטלוג ואימות של מסמכים אלה, מה שיכול להימשך עשרות שנים. כל מסמך מתווסף באופן עצמאי על ידי שלושה מתנדבים, ואם הערכים שהוכנסו אינם תואמים במדויק הרי שהם נבדקו על ידי עובד ארכיון ארוסלן שהכריע בעניין. למעשה נדרשו עד היום בממוצע ארבע אנשים כדי לאנדקס במדויק ארבעה מסמכים במהלך שעה אחת.

איאן לוור, מתנדב אקסנצ'ר ופעיל בקבוצת העובדים היהודית בחברה (באקסנצ'ר מועסקים למעלה מ-670 אלף עובדים ועובדות ברחבי העולם), הבין במהירות שבינה מלאכותית יכולה להאיץ את התהליך הזה באופן משמעותי. לוור הצליח לרתום מתנדבים אחרים ב-אקסנצ'ר ותוך 10 שבועות הקבוצה הצליחה ליצור פתרון AI ייעודי לאינדוקס מסמכי מכון ארולסן.

האוסף הגדול בעולם של מסמכים המתעדים את רדיפות הנאצים - מעל 110 מיליון מסמכים וחפצים דיגיטליים. ארכיון ארולסן.

האוסף הגדול בעולם של מסמכים המתעדים את רדיפות הנאצים – מעל 110 מיליון מסמכים וחפצים דיגיטליים. ארכיון ארולסן. צילום: אקסנצ'ר

לחלץ מידע ממסמכים שקריאתם קשה במיוחד

המתנדבים עבדו עם צוותי המומחים של קבוצת ה-AI.Solutions של אקסנצ'ר, והצליחו להשמיש פתרון קיים של אקסנצ'ר AI, העושה שימוש בזיהוי תווים אופטי וטכנולוגיית מתקדמות אחרות אשר מאפשרות לחלץ מידע ממסמכים שקריאתם קשה במיוחד גם עבור העין האנושית. אלו כוללים רשומות של אסירים ועצורים המכילים עשרות שורות, כמו גם רישומי מחנות ריכוז ומסמכים מנהלתיים נוספים של השלטון הנאצי המכילים מידע אודות מיקומם וגורלם של משפחות שלמות.

מכיוון שה-AI לוכד את המידע מהר יותר ומגביר את הדיוק שלו ככל שהתהליך נמשך, הרי שארבעה מתנדבים יכולים כעת לאמת כ-160 מסמכים בשעה אחת – הכפלה של פי 40 בהספק.

מאז שאקסנצ'ר הטמיעה את הפתרון בדצמבר 2021, נוספו לאינדקס של מכון ארולסן יותר מ-160,000 שמות של קורבנות רדיפות הנאצים, חולץ מידע מיותר מ-18,000 מסמכים, ואוגדו יותר מ-60,000 מסמכים לקבוצות דומות, כדי לשפר את הזיהוי והניתוח. כ-1,000 אנשי אקסנצ'ר התנדבו לפרויקט עד היום, כאשר אקסנצ'ר תומכת גם בתחזוקה ובפיתוח נוסף של פתרון הבינה המלאכותית.

למרות שהבינה המלאכותית עושה את מרבית העבודה, הפיקוח האנושי חיוני לתהליך, לא רק כדי להבטיח דיוק, אלא גם כדי לבצע למידה אודות תפקוד הבינה המלאכותית. על ידי עיון ותיקון מידע, מתנדבים "מלמדים" את הפתרון לזהות תווים וקיצורים בכתב יד שהיו אופייניים לתקופה.

הודות למאמץ האנושי עד כה, הבינה המלאכותית שיפרה בהדרגה את הדיוק שלה ב-10% ופועלת כעת ברמה של 99% הצלחה.

מסמך מארכיון ארולסן.

מסמך מארכיון ארולסן. צילום: אקסנצ'ר

"נרגשים מההיענות המתנדבים, כמו גם מהרצון והיכולות המקצועיות שלהם"

"אנו גאים במאמצים של העובדים שלנו לעזור ולשמר את זכרם של מי שעברו תלאות וסבל בלתי נתפשים, במיוחד בתקופה שבה אנטישמיות, גזענות ולאומנות קיצונית שוב זוקפים את ראשן המכוער", אמר דיוויד מטניק, מנהל תחום החינוך והמגזר הציבורי באקסנצ'ר, ארה"ב, ומי שלקח את הפרויקט תחת חסותו. "ראינו בעיה, אשר מגלמת בתוכה הזדמנות לממש את הערכים שלנו כחברה וכבני אדם, ולרתום את הטכנולוגיה שלנו לטובת הכלל".

"אנחנו נרגשים מההיענות של המתנדבים, כמו גם מהרצון והיכולות המקצועיות שהם הפגינו בכל הנוגע להליך הדיגיטציה של הארכיון שלנו", אמרה פלוריאן אזולאי, מנהלת ארכיון ארולסן.

"אנחנו המומים מכמה מתנדבים תומכים בדיגיטציה של הארכיון שלנו", הוסיפה אזולאי. "שיתוף הפעולה שלנו עם הצוות של אקסנצ'ר הוא יוצא דופן בכל אספקט שלו. מדובר בהישג מדהים שיאפשר לנו להנגיש את תוכנם של עשרות מיליוני מסמכים, המכילים מידע חשוב אודות גורלם של קורבנות הרדיפות הנאצים במהירות שיא, ואף יאפשר לרבים מסביב לעולם לגלות מה עלה בגורל יקיריהם".

תגובות

(2)

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אין לשלוח תגובות הכוללות דברי הסתה, דיבה, וסגנון החורג מהטעם הטוב

  1. כהן ישראל

    בוקר טוב , ואיפה אפשר לעיין במסמכים ?

אירועים קרובים