האם חברות פיננסיות באמת צריכות דאטה לייק?
במשך שנים הוצגו מאגרי הנתונים כהבטחה הגדולה של עולם הפיננסים ● בנקים וגופים פיננסיים השקיעו הון בתשתיות מידע, אך לעיתים קרובות הפער בין החזון למציאות התגלה כגדול במיוחד
לפני כמה שנים ישבתי בדיון הנהלה שבו הוצגה תכנית לבניית דאטה לייק (Data lake) ארגוני. השקופיות היו מרשימות: ריכוז כל מקורות המידע במקום אחד, יכולות אנליטיקה מתקדמות, בסיס לבינה מלאכותית עתידית. התקציב המבוקש היה גבוה, אבל השאלה "לשם מה בדיוק?" לא קיבלה תשובה ממוקדת. הפרויקט אושר. שנתיים אחר כך, רוב הנתונים ישבו במאגר ואיש לא ממש השתמש בהם.
זה לא סיפור יוצא דופן. בעשור האחרון שכנעו עצמם גופים פיננסיים רבים שמאגר נתונים מרכזי הוא תנאי קיומי להישרדות תחרותית. בנקים, חברות ביטוח, גופי אשראי ופינטקים שפכו משאבים לתשתיות מתקדמות מתוך תפישה שהמידע הוא הנכס האסטרטגי החשוב מכל.
הרעיון עצמו לא מופרך: לקחת נתונים מעשרות מערכות שונות, הלוואות, לקוחות, עסקאות, פניות, מסמכים, ולרכז אותם במקום אחד כדי לייצר ממנו ידע. הבעיה היא שהמרחק בין המאגר לבין הידע שהיה אמור לצמוח ממנו התגלה, בפועל, כארוך בהרבה ממה שאיש תכנן.
יש אשליה נוחה שלפיה די לאסוף מספיק נתונים, והתובנות יגיעו מעצמן. הניסיון מלמד אחרת. חברות שהשקיעו שנים בבניית מאגרי ענק מתקשות לעיתים להצביע על החלטה עסקית אחת שהשתנתה בגלל כל אותו מידע
כשהאגם הופך לביצה
הכשל הנפוץ ביותר בפרויקטים כאלה אינו טכנולוגי. הוא ניהולי. ארגונים שואלים "איך בונים דאטה לייק?" לפני שהם שואלים "מה אנחנו מנסים לעשות עם הנתונים?". ההבדל נשמע סמנטי, אבל התוצאות שלו מאוד קונקרטיות.
בלי הגדרה ברורה של מטרות, מאגרי הנתונים הופכים למה שהתעשייה מכנה data swamp, ביצת נתונים – מיליארדי רשומות שנצברות בלי מבנה, בלי בעלות ברורה, בלי הגדרות אחידות. ואז מגיע הרגע שבו שני אנליסטים מריצים את אותה שאילתה ומקבלים תוצאות שונות. מי מהם צודק? לרוב אי אפשר לדעת. וכשאי אפשר לדעת, הנתונים מפסיקים לשמש בסיס להחלטות ומתחילים לשמש בסיס לוויכוחים.
בעולם הפיננסי זה בעייתי בצורה מיוחדת. החלטות אשראי, ניהול סיכונים ועמידה בדרישות רגולטוריות דורשים מספרים שאנשים שונים בארגון יכולים לסמוך עליהם. כשמנהל האשראי ומנהל הסיכונים עובדים עם נתונים שונים, אפילו תשתית מתקדמת לא תציל אותם.

האם הוא חיוני? דאטה לייק בתחום הפיננסים. צילום: אילוסטרציה. ChatGPT
הנתונים לא חושבים לבד
יש אשליה נוחה שלפיה די לאסוף מספיק נתונים, והתובנות יגיעו מעצמן. הניסיון מלמד אחרת. חברות שהשקיעו שנים בבניית מאגרי ענק מתקשות לעיתים להצביע על החלטה עסקית אחת שהשתנתה בגלל כל אותו מידע.
הנקודה הבסיסית היא פשוטה: נתונים הם חומר גלם, לא מוצר מוגמר. הם רוכשים ערך רק כשהם משולבים בתהליכים שמשפיעים על תוצאות. מודל שמסייע לנהל את תיק ההלוואות טוב יותר הוא בעל ערך. מערכת שמאתרת הונאה לפני שהנזק נגרם היא בעלת ערך. כלי שמזהה לקוח שעומד לעזוב ומאפשר לפנות אליו מראש הוא בעל ערך. לעומת זאת, מאגר של שלושה טרה-בייט שאיש לא מריץ עליו שאילתות הוא בעיקר עלות תפעול שוטפת. לא מעט מנהלים הגיעו לתובנה הזו באיחור ניכר ולאחר השקעה שלא חזרה.
כשה-AI נכנסת לתמונה המצב מסתבך
בשנה-שנתיים האחרונות מגיע לחץ חדש: אם אין לנו דאטה לייק, איך נוכל לעבוד עם בינה מלאכותית? הטיעון נשמע הגיוני, אבל הוא לא בהכרח נכון. מערכות AI לא ממירות נתונים גרועים לידע טוב. לרוב הן עושות את ההפך. הן מגדילות את הביטחון בתוצאות, תוך שהן מנציחות שגיאות שהיו קיימות ממילא.
אם נתוני הלקוחות אינם עקביים בין מערכות, אם שדות חסרים באופן שיטתי, אם אותו מידע נשמר בפורמטים שונים במחלקות שונות, המודל המתקדם ביותר יספק תוצאות בעייתיות. ה-AI לא "תחכים" את הנתונים. היא תעבוד איתם כפי שהם.
מה שארגונים מתחילים להבין, ולדעתי בצעד נכון, הוא שלפני שמרחיבים את מאגרי המידע כדאי לשאול אם המידע הקיים כבר מנוהל נכון. האם יש הגדרות אחידות? האם יש מישהו שאחראי על איכות הנתונים? האם כולם מדברים על אותם מדדים באותה שפה? אלה שאלות שהתשובות עליהן לא דורשות פרויקט ענן יקר. לפעמים הן דורשות ישיבה אחת עם האנשים הנכונים.
פחות זה לפעמים יותר
אז האם חברות פיננסיות צריכות דאטה לייק? לגופים גדולים עם עשרות מערכות ומיליוני לקוחות, ריכוז הנתונים עשוי להיות הכרחי. אבל חברות פיננסיות קטנות ובינוניות, ורובנו שם, שואלות את עצמן שאלה אחרת לגמרי: מה הבעיה העסקית שאנחנו רוצים לפתור, ומהי הדרך הפשוטה ביותר לפתור אותה?
במקרים רבים התשובה אינה מאגר נתונים ענקי, אלא – כמה מאגרים ממוקדים, ממשל נתונים שמישהו באמת מיישם והגדרה ברורה של אילו החלטות אנחנו רוצים לשפר. זה פחות מרשים בשקופית הנהלה. אבל זה עובד.
בסופו של דבר, פרויקטי דאטה לא נמדדים בטרה-בייטים. הם נמדדים בהחלטות שהשתנו לטובה בגללם. בעולם שבו כל החלטת אשראי נוגעת בסיכון אמיתי ובאדם אמיתי, זה המדד היחיד שצריך לעניין אותנו.
הכותב הוא יועץ טכנולוגי לארגונים, בעיקר בתחום האשראי החוץ בנקאי ובעברו מנמ"ר










תגובות
(0)