שיפוץ חד-פעמי או תחזוקה שוטפת? שש המלצות לבניית מאגר מידע איכותי

דבר אחד ברור - הבית זה הנכס שלכם - נכון? כך גם מאגר המידע הארגוני ● הדטה שלכם הוא נכס יקר ערך, ובהבדל אחד מהבית - על בסיס הדטה, אתם מקבלים החלטות עסקיות הרות גורל ● כעת תחשבו כיצד אתם רוצים לשמור על הנכס הזה

אדר שומרון, מנכ"ל BIyond. צילום: פלי הנמר

מתי בפעם האחרונה שיפצתם את הבית שלכם? טיפלתם בעובש שמצטבר בחדר האמבטיה? ריססתם את הבית מפני חרקים? רעננתם את הגינה שלכם?

האם אתם נמנים על האנשים שמתחזקים את הבית שלהם בשוטף או דווקא על אלה אשר פעם בחמש שנים נכנסים לעבודת שיפוץ גדולה, ומגלים כי המצב ממש התדרדר?

הבית זה הנכס שלכם –  עכשיו תחשבו כיצד אתם רוצים לשמור על הנכס הזה. וכמו הבית – כך גם מאגר המידע הארגוני. הדטה שלכם הוא נכס יקר ערך. בהבדל אחד מהבית – על בסיס הדטה, שמור או מוזנח, אתם מקבלים החלטות עסקיות הרות גורל. עכשיו, תחשבו כיצד אתם רוצים לשמור על הנכס הזה.

לפי דן אנד ברדסטריט (Dun and Bradstreet) עד 96% מכתובות הדואר האלקטרוני ונתוני הקשר של הלקוחות במערכות לקשרי לקוחות בארגונים, אינם נכונים או נכונים בחלקם. האם גם הדטה שלכם באמת במצב כזה גרוע?

שכפול המידע הקיים

לאורך זמן, איכות הדטה יורדת ב-2% בחודש וכך חלה התדרדרות הדרגתית של איכות המידע. מספיק שעובד משנה תפקיד בחברה ומשנה את פרטי ההתקשרות עימו כדי לפגוע באיכות הדטה. מדי פעם, המערכות אף משכפלות את המידע הקיים או מאייתות מילים בצורה שגויה, וכן הלאה.

במחקר של StreamSets, שני שליש מן המשתתפים הצביעו על שלושה אתגרים בשמירה על איכות הדטה; שמירה על דיוק המידע, שלמותו ועקביותו. לעומת זה, רק למעלה ממחצית המשתתפים טענו גם כי סוגיות תפעול ואבטחת מידע מעסיקות אותן. העובדה כי איכות המידע דורגה כאתגר מטריד אף יותר מסוגיות אבטחת מידע ורגולציה, היא עובדה מרעישה.

גם לעידן ה-Big Data תפקיד מכריע בבלאגן הזה. מטבעו, הוא מציף את הארגון בנתונים לא נחוצים. למשל, 87% ממשתפי המחקר של StreamSets הודו כי הם מאפשרים ביודעין למידע לא איכותי לחדור למרכזי הנתונים שלהם.

תהליך קבלת החלטות שגוי

החוכמה היא להשכיל ללקט את המידע שחיוני לארגון, ולהחזיק רק בו. האיכות חשובה בהרבה מן הכמות, אומר גם יניב מור, מנכ"ל Xplenty, במאמר שפרסם CMSWire. מדוע האיכות כל כך חשובה? משום שמידע לא איכותי, או חלקי, יכול להוביל אתכם לתהליך קבלת החלטות שגוי וזה גרוע יותר מלא לקבל שום החלטה.

אבל אם כבר הדטה נאסף והתיישב במרתפי מערכות המידע, איך בכל זאת תשפרו את איכותו – וחשוב יותר, איך תתנהלו עם הדטה החדש שאתם צוברים? הנה מספר המלצות שכדאי לאמץ:

מנו מנהל נתונים ארגוניים (Chief Data Officer) ותנו לו להרכיב צוות משלו. אל תשאירו את הנושא בידי מחלקת ה-IT שכן לא מדובר כאן בשיפוץ חד-פעמי, אלא בתהליך רצוף של שימור הדטה ואיכותו. חשוב אגב שה-CDO יהיה בכיר שלוקח חלק בישיבות הנהלה ויש לו Say. כל המהלך הזה יתרום לבניית תרבות ארגונית מתאימה ביחס לדטה.

● הגדירו מדיניות טיפול בדטה ומטרות ארוכות טווח. מידע לא איכותי מקורו בקורוזיה ובאובדן מידע הנגרמים מזליגת מידע (Data Drift). זליגת מידע מתרחשת באופן בלתי צפוי וכוללת הן שינויים במבנה של מאגר הנתונים והן שינויים בסמנטיקה.

הסיבות לכשל הזה, בין השאר, הן שימוש בפתרונות שפותחו בסטנדרט נמוך של עבודה ואינם עמידים בפני שינויים במבנה של מאגרי הנתונים, ואף תוכננו כך שלא ניתן יהיה לנטרם. בשלב הזה עליכם להסתכל קדימה ולתכנן כיצד אתם מייצרים דטה איכותי לאורך זמן, או במילים אחרות, כיצד אתם עוקרים את העשבים השוטים מן השורש. עוד כדאי בשלב זה, לזהות מה מקור הטעויות ולקבוע נהלים שימנעו הישנות הטעויות.

● אחדו ושלבו את מערכות המידע שלכם. לרוב, ארגונים נאבקים עם איכות הדטה משום שהם מאחסנים אותו במערכות מידע שונות במקביל. זו כמובן תולדה של עולם ה-IT הישן, בו לכל פונקציה פיתחו מערכת חדשה שלא ידעה לדבר עם כל המערכות המקבילות לה. תשתיות ה-Legacy, לרוב מבודדות ונעדרות תמיכה, לא שיפרו את המצב. במצב של ריבוי מערכות מידע, שלא יודעות להסתנכרן, לעולם לא תוכלו לקבל תמונת מצב שלמה ומלאה של הלקוח המסוים, וכך תחמיצו הזדמנויות מכירה.

● נרמלו את הדטה שלכם. המידע מגיע אליכם ממקורות שונים (קבצים פנים-ארגוניים, קבצים חיצוניים, מיילים, רשתות חברתיות, אתרי אינטרנט ועוד) ובפורמטים שונים (קבצי Word, קבצי Excel, תמונות, וידיאו ועוד). מקורות המידע האלה שונים מבחינה טכנולוגית, יש בהם שדות שונים והפורמט שלהם שונה. על מנת שישבו במאגר מידע אחד וישמשו אתכם בצורה יעילה, חשוב לנרמל אותם ולהכניס אותם לפורמט אחיד.

● העשירו והשביחו את הדטה. אם אתם מסתמכים רק על הדטה שאתם אוספים, אתם עלולים להחמיץ הזדמנויות עסקיות. לכן, מומלץ לרכוש מאגרי מידע של גורם צד שלישי, למשל מאגר של רשם האוכלוסין, ולהעשיר את הדטה שלכם במידע נוסף על הלקוחות. המידע הזה יתרום רבות לתהליך קבלת ההחלטות שלכם, לפרסונליזציה בפניה ללקוח, לחוויית הלקוח והצעות הערך שאתם מציעים לו, ובשורה התחתונה, להצלחה העסקית שלכם.

● השתמשו בכלים אוטומטים כדי לטייב נתונים. ישנם היום כלים אוטומטים שיכולים לאתר אלפי טעויות בדטה שלכם תוך מספר דקות. לכלים אלה יכולות מרשימות, וביניהם, כלים היודעים להבחין בין אותיות דומות בעברית כמו "צ" ו- "ד" או כלי שיודע לזהות  טעויות בפורמט, כמו ההבדלים בין כתיבת תאריך באנגלית לעומת עברית. אמצו כלים אוטומטיים שיתפסו את השגיאות לפני שהן מתברגות במאגר הנתונים.

בשנים האחרונות הנושא של טיוב נתונים קפץ כיתה, אם לא שתיים. האינטרנט של הדברים תורם רבות להגדלת נפחי המידע, ה-Big Data תופס את קדמת הבמה ועימה טכניקות עבודה של Data Science ו-Analytics, הצרכנים התרגלו לחיות ב-Real Time ולקבל מענה מיידי לכל בעיה, והם מצפים לקבל מהספקים הצעות ערך מדויקות בתמורה לפרטיות עליה ויתרו. על רקע כל אלה, איכות הדטה הפכה להיות גורם חשוב בהשגת היעדים העסקיים.

הכותב הוא המנכ"ל והבעלים של BIyond, המתמחה בעולמות ה- BI, Big Data Analytics ו-Data Science, ומסייעת לחברות להפיק יותר ערך עסקי מה-Data שלהן.

תגובות

(0)

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אין לשלוח תגובות הכוללות דברי הסתה, דיבה, וסגנון החורג מהטעם הטוב

אירועים קרובים