מדוע פרויקטי הדטה קטלוג נכשלים?

הגדרה רוחבית של פרויקט קטלוג נמשכו זמן ארוך מאוד, עלו הרבה מאוד כסף ולא הניבו תוצרים בעלי ערך כלכלי

יוסי רודריק, מנכ"ל aQurate.

רבות נאמר לגבי היתרונות שארגונים יכולים להשיג כאשר הם שולטים בדטה שלהם. בין אם הדטה נמצאת בתוך הארגון ובן אם היא מגיעה ממקורות חיצוניים לארגון.

ריבוי מקורות המידע הנובע מריבוי מערכות המידע הארגוניות והחוץ ארגוניות (רשתות חברתיות, פורטלי ספקים ועוד) מחייב הקמת קטלוג של הנתונים. קטלוג הנתונים הוא בעצם מאגר של כלל המטא דטה הארגונית, שמטרתו לסייע לצרכן המידע (לקוח, אנליסט, מדען נתונים וכו') לחפש ולאתר את מקור הנתונים הכי רלוונטי והכי אמין לצרכיו.

כדי להמחיש ולחדד, נסו לדמיין ספרייה גדולה, שבה הספרים אינם מסודרים ואין אינדקס מסודר שניתן לחפש ספר מסוים, במצב כזה הספרייה תחדל מלהתקיים. כך המצב במרבית הארגונים – קיים אינדקס חלקי אך לא מעודכן, ולפעמים הוא לא מכיל את כל הנתונים או המקורות.

לאור הצורך והתועלות שיש בניהול הדטה, יש צורך לבחון מדוע מרבית פרויקטי הדטה קטלוג דווקא לא הצליחו.

"הצלחת פרויקט דטה קטלוג מחייבת להגדיר את היקף הפרויקט, למקד אותו ולבדוק שהוא פותר בעיה עסקית אקוטית על מנת לתת ליחידה ספציפית בארגון תוצרים שיביאו ערך"

של מי הדטה?

אחד הנושאים החשובים הוא לברר מי אחראי על הנתונים? האם אנשי ה-IT או המשתמשים עצמם, שמזינים את הנתונים ועושים שימוש במערכות השונות? כדי להבהיר את השאלה, נוסיף ונשאל לדוגמה – במידה ובמערכת חסרים נתוני כתובת של לקוחות מסוימים, מי אחראי לכך? כמובן שהמשתמש הסופי. אבל, אם במערכת אחרת הוכנסו ערכי ברירת מחדל לא תקינים או הוכנסו עמודות לניהול נכון של בסיס הנתונים אזי האחריות היא של ה-IT. ולכן, במצב של בעיה באיכות הדטה, כל אחד מהמשתמשים בו יהיה אחראי לתיקון השגיאות שלו.

לבניית קטלוג בצורה נכונה חייב להיות ייצוג מלא של כל המשתמשים.

מרכיבי היישום

על מנת לבנות ולתחזק דטה קטלוג נצטרך ארבעה מרכיבים:

  1. מנגנון טעינה של המטא דטה, מבנה הנתונים.
  2. ממשק משתמש מודרני ופשוט להזנת הקונטקסטפר עמודה עסקית (קטלוג).
  3. מנוע חיפוש רובסטי שיאתר את מקור הנתונים הרלוונטי וכן גם יציין את רמת איכות הנתונים באמצעות Data Profiling אוטומטי. ובהתייחס לדוגמתה, ספרייה – אנו רוצים לדעת לא רק היכן הספר מונח אלא מה איכותו ואילו הערות יש לגבי תוכנו ממשתמשי הארגון השונים.
    המנוע צריך להיות פתוח למשתמשים מחוץ לארגון דרך פורטלים, בנוסף למשתמשים בתוך הארגון.
  4. ממשק משתמש ידידותי שיציג Data Lineage של כל נתון. לדוגמה, אם מקור הנתונים היה תאריך לידה, אז איך הגענו לנתון גיל.

מבחינה טכנית מרבית המוצרים הקיימים היום לבניית דטה קטלוג תומכים במידה כזו ואחרת בארבעת המרכיבים. אם כך, הכשלים ביישום דטה קטלוג ארגוני נבעו מסיבות אחרות אותן נפרט….

הגדרת היקף הפרויקט ומיקודו – SOW

הגדרה רוחבית של פרויקט קטלוג לא תצלח. זאת אנו למדים מעשרות פרויקטים שנכשלו. הם נמשכו זמן ארוך מאוד, עלו הרבה מאוד כסף ולא הניבו תוצרים בעלי ערך כלכלי.

הצלחת פרויקט דטה קטלוג מחייבת להגדיר את היקף הפרויקט, למקד אותו ולבדוק שהוא פותר בעיה עסקית אקוטית על מנת לתת ליחידה ספציפית בארגון תוצרים שיביאו ערך. לאחר סיום הפרויקט בהצלחה יש להרחיבו ליחידה נוספת בארגון ובהמשך ליחידות נוספות לפי שיקולי עלות תועלת וסדרי עדיפויות.

הגדרת הלקוח או הלקוחות

Owner

  1. יש להגדיר OWNER ברמת הנהלה בכירה שהוא המשתמש העסקי שילווה את הפרויקט כדי שיוכל למדוד בצורה כמותית את התוצרים.
  2. יש לקבל מחויבות מצד הלקוח להשתתפות בתהליך ההקמה והתחזוקה השוטפת כולל הקצאת כוח אדם מצד הלקוח לטובת הקטלוג והתמיכה בשינויים השוטפים.
  3. יש לקבל מחויבות מהלקוח להקצאת כוח אדם לטיוב נתונים במידה ונחוץ.
  4. יש לוודא שלמערכת החדשה יהיו לקוחות משתמשים (דטה אנליסטים) שיעשו חיפוש וישלפו את הנתונים הרלוונטיים –יש לשים לב לכך שמי שאמור לבנות ולתקן את הליקויים אינו בהכרח הצרכן הסופי.

IT

מרבית הלקוחות שהגדירו את הפרויקט כפרויקט IT מתכנס, ימצאו עצמם ללא תקציב ללא יכולת להציג ROI וללא תוצרים ומשתמשים.

  1. הגדרת פרויקטי משנה קטנים לכל מחלקה, נושא או תחום בארגון כולל מדדי הצלחה כמותיים.
  2. בניית מתודולוגיה מסודרת ליישום על סמך ניסיון מצטבר ופרויקטים שנעשו במקומות אחרים.
  3. אספקת תוצרים מהירה בהתאם ללוחות הזמנים שהוגדרו. כל חצי שנה הרחבת הקטלוג באמצעות הכנסת מקורות נתונים נוספים.
  4. מתן אפשרות לשליפת נתונים באמצעות מנגנוניSelf Service למשתמש הקצה (דטה אנליסט) תוך שימת דגש שהתהליך יהיה רציף ויכיל מנגנון הרשאות מתאים.
  5. הקצאת משאבים לטובת מוקד תמיכה עסקי למשתמשי הארגון ולא דווקא טכני (מידענים) לפתרון בעיות של איכות נתונים וחיפוש.

שני הצדדים צריכים להבין שהתהליך הינו תהליך מתמשך ואינו מסתיים, כיוון שהשינויים לעולם ימשיכו הן ברמת מבני הנתונים והן ברמת מקורות הנתונים.

לסיכום

קיימים פרויקטי דטה קטלוג מוצלחים. הגישה עליה אנו ממליצים היא הכשרה של ה-IT והלקוח העסקי בארגון בצורה משולבת לגבי הכלים, הגדרת מדדי הצלחה והדרכה לגבי המתודולוגיה ושיטת העבודה, כולל בעלי תפקידים רלוונטיים בארגון כמו-OWNERS DATA STEWARDS ועוד. חשוב לתחום את הפרויקט לנושא ספציפי, עם מדדי הצלחה ספציפיים בני מדידה, ומשם להרחיב את הפרויקט ללקוחות נוספים.

סוף דבר – גוף שרוצה להפיק את המירב מהנתונים שלו חייב להסתגל לשינוי בו הלקוח העסקי הינו שותף פעיל בכל הנוגע לאיכות הנתונים וקטלוגם לטובת השגת היעדים העסקיים המשתנים של הארגון.

 

הכותב הוא מנכ"ל קבוצת UCL.

תגובות

(0)

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אין לשלוח תגובות הכוללות דברי הסתה, דיבה, וסגנון החורג מהטעם הטוב

אירועים קרובים