פודקאסט אנשים ומחשבים: דילוג לאתר חלופי תחת אש במנורה מבטחים

יניב כץ, מנהל התשתיות במנורה מבטחים, ומתן סיטבון, סמנכ”ל הטכנולוגיות באשנב, מספרים על פרויקט DR רחב היקף שהסתיים בחברה ימים אחדים לפני מלחמת "עם כלביא", כשאף אחד לא חשב שהמימוש שלו יהיה כל כך קרוב

מימין: מתן סיטבון, סמנכ"ל הטכנולוגיות בחברת אשנב מקבוצת אמן, ויניב כץ, מנהל מחלקת תשתיות במנורה מבטחים.

לפני חצי שנה, במלחמת "עם כלביא", נפל טיל באזור שבו שוכנים המשרדים של חברת מנורה מבטחים. למרבה המזל, לא הייתה פגיעה במבנה, ולא בחדר השרתים, ולמרות זאת, הנהלת החברה החליטה לבצע דילוג לדאטה סנטר ייעודי חלופי באזור המרכז, הפועל בשיטת הגיבוי אקטיב-אקטיב.

אבל זה לא היה הנס היחיד שקרה לחברה באותו יום. זמן קצר לפני פרוץ המלחמה סיימה מנורה מבטחים להטמיע פרויקט DR רב שלבי, שנועד להתאים את תשתיות האחסון והגיבוי של החברה לאתגרים הקיימים, וגם לבצע חידוש ציוד. בעקבות זאת ביצעה החברה תרגיל סיכום כולל של דילוג והתנהלות בשעת חירום, בנוהל הרגיל המקובל. אף אחד לא העלה בדעתו, שהמבחן הראשון של פרויקט ה-DR יהיה כל כך קרוב, בזמן אמת תחת אש. ואכן הדילוג באותו בוקר שבו נפל הטיל עבר בהצלחה, והרציפות התפקודית של החברה לא נפגעה.

כדי לשמוע על פרויקט ה-DR, ההיערכות בעקבות נפילת הטיל והלקחים שהופקו, שוחחנו עם יניב כץ, מנהל מחלקת תשתיות במנורה מבטחים, שהוביל את הפרויקט ואת, מתן סיטבון, סמנכ"ל הטכנולוגיות בחברת אשנב מקבוצת אמן השותפה העיקרית של מנורה מבטחים לפרויקט הגדול הזה.

 יניב כץ, הצג את עצמך?

"אני בתחום שנים רבות, עבדתי בחברות אינטגרציה שונות. בעשר שנים האחרונות אני במנורה מבטחים, ובשלוש השנים האחרונות מנהל תחום התשתיות באופן מלא. המשימה העיקרית שלנו היא לדאוג לרציפות תפקודית מלאה, אבטחת מידע, כל נושא הענן, AI ועוד".

 מתי נחשפת לראשונה לעולם הטכנולוגיה?

"למדתי בבית ספר מקצועי, ולתחום המחשבים נחשפתי בעת שירותי הצבאי, זה מצא חן בעיניי ואחרי השחרור התחלתי את המסלול, כולל לימודי תואר ראשון במינהל עסקים".

 תאר את התהליכים של פרויקט ה-DR שהחל לפני המלחמה.

"הרעיון החל כאשר הגיע לאגף המנמ"ר יקי זנו, ואז הוחלט שנושא ה-DR יהיה בראש סדר העדיפויות שלנו, כולל הצבת יכולות דילוג מלא, של כל התשתיות במקרה חירום, ויישום תפיסת אקטיב-אקטיב שלא הייתה קודם. היעד שהצבנו לעצמנו הוא: שכל התשתיות שלנו יעבדו באופן מלא מאתר ה-DR שלנו, כאשר חילקנו את זה לנושאים ותת נושאים, עולם הווירטואליזציה, עולם התקשורת, אינטרנט ועוד".

כמה זמן ארך כל הפרויקט?

"זה בעצם לא פרויקט אחד, אלא אוסף של מספר פרויקטים, כל אחד כאשר בסוף צריך להגיע לנקודה, שנוכל להגיד שבעצם אנחנו יודעים לעבוד באופן מלא מהאתר הגיבוי. ההתחלה הייתה בשנת 2023, כאשר תאריך הסיום היה 2025, ולשמחתי עמדנו בלוז ואף מעט הקדמנו אותו, למרות שנתיים לא פשוטות שעברנו.

"בחודש מאי בשנה שעברה עשינו תרגול על מלא של העברת כל הארגון לאתר הגיבוי במקרה חירום. כמובן, איש לא חשב על מלחצת "עם כלביא". לשמחתנו, התרגיל עבר בהצלחה, וכמובן הפקנו לקחים. בדיעבד, זה מה שאפשר לנו ברגע האמת לדלג בקלות. מה שנקרא 'קשה באימונים קל בקרב'…"

קח אותי לרגע שבו אתה מקבל הודעה שהטיל נפל באזור שלכם.

"הטיל נפל בשעות הבוקר, והדבר הראשון, כמובן, היה שיצרנו קשר עם העובדים לוודא שכולם בסדר. ואז פיקוד העורף פינה את כל האנשים מהסביבה. בשלב הזה לא ממש ידענו מה המצב בשכונה, אבל חששנו שעלולות להיות הפסקות חשמל בגלל עבודות הפינוי. הייתה לנו אפשרות לעבוד גם אם תהיה הפסקת חשמל, אבל לא ידענו כמה זמן זה יימשך. התקבלה החלטה בשעה 09:30 לבצע את הדילוג, כל מה שדורש אקטיב-אקטיב, כדי להבטיח רציפות תפקודית וכל מי שעובד מרחוק ימשיך לתת שירות לכל הלקוחות. וכך היה. רוב העובדים לא הרגישו בשינוי, ועד סוף הערב השלמנו את הדילוג. אחרי שבועיים חזרנו לעבודה רגילה".

איך התמודדתם עם האתגר שמערכת הליבה שלכם היא AS400?

"נכון, מדובר במערכת מאוד ותיקה, היא מושתתת על איזהשהו מחשב מרכזי, שיש בו מספר מחיצות ,שמחובר לקאחסון מרכזי. המערכת בעצם יודעת לקחת את הדאטה שיש בסטורג' המרכזי ולרפלק אותו לאתר המשני. ברגע שמחליטים לדלג, בעצם יש פעולה שמורידים את המחיצות באתר הראשי ומדליקים את המחיצות באתר המשני – פעולה שלוקחת משהו כמו חצי שעה, ואז המערכת באתר הגיבוי זמינה. לאורך כל הדרך הייתה מטרה אחת: לשמור על רציפות תפקודית, שהיא דבר קריטי מאוד בחברה כמו שלנו. זו משימה מורכבת, אני קראתי לזה להחליף מנוע של מטוס תוך כדי טיסה".

 מתן סיטבון, ספר כמה מילים על עצמך.

"התחלתי את הקריירה שלי בממר"ם, אבל האהבה לטכנולוגיה באה מהבית, גם אחותי הגדולה הייתה בממר"ם. אחרי השחרור עבדתי בתחומים שונים. אחר כך עברתי לחברת אשנב מערכות, שהייתה אז בבעלות פרטית. לפני ארבע שנים אמן רכשה אותנו, ואני ממשיך לעבוד בחברה במסגרת קבוצה זו. יש לנו 20 עובדים ואנחנו פועלים בישראל וגם בחו"ל".

 מה המיתוג שלכם?

"אשנב מערכות מידע היא חברה בתוך קבוצת אמן, שאחראית על כל מה שקשור בפתרונות תשתיות, הגנת מידע, גיבוי, פתרונות שחזור, אבטחת סייבר ושירותי אינטגרציה. אנחנו יודעים לתת ללקוחות פתרונות, שכוללים גם את עולמות הסייבר וגם את עולמות התשתית, או במילים אחרות, פתרונות מקצה לקצה".

איך אתה רואה את הפרויקט במנורה שאתם הייתם שותפים מלאים לו?

"ראשית, מדובר בעולמות ה-AS400, שאינם נחשבים כיום כמיינסטרים טכנולוגי, עם כל המשמעויות הכרוכות בכך. מדובר על שרתים ייחודיים, המריצים מערכות הפעלה ייחודיות, או במילים אחרות, סביבות לגאסי. זו מערכת שאומצה לפני שנים על ידי חברות ביטוח, שבאמת צריכות מערכות שיודעות להתמודד עם הרבה מאוד חישובים במקביל, וזה לא השתנה עד היום.

"חייבים לומר, שמעבר לצד הטכנולוגי, קיבלנו את האמון מצד הנהלת מנורה מבטחים, ומבחינתנו בפירוש זה לא היה עוד פרויקט ועוד לקוח, למרות שכבר היה לנו ניסיון בחברות אחרות עם מערכות כאלו. ביבמ אומרים שמערכת הליבה במנורה היא אחד האתרים הגדולים ביותר בעולם במערכות 400AS. בוודאי במזרח התיכון.

"האתגר הראשון היה בעצם להבין את גודל המערכת, את ההיקף שלה, איפה היא נוגעת, אילו מערכות יושבות בפנים, איזו טכנולוגיות דרושות, מה דורש חידוש או שדרוג – והכל כדי לאפשר זמינות עסקית מקסימלית".

תאר את התהליכים בדרך?

"בשלב הראשון עשינו קודם כל מיפוי של כל התשתיות, וכל הרכיבים הקשורים אליה. זה לקח כמה שבועות, וכבר היה ברור לנו שיש צורך להחליף חלק גדול מהציודים, שחלקם היו כבר בני יותר מחמש שנים, זו התקופה שהם מתיישנים. ביצענו גם קונסולידציה עם מערכות שהיו באתר הגיבוי, ששימשו בעיקר את הסביבה היצרנית, אבל לא הייתה בטופולוגיית אקטיב-אקטיב. היה פה גם שינוי בתפיסת העבודה, כי חלק מהתהליכים נעשו במיקור חוץ עם קבלן חיצוני, ועכשיו איחדנו את כולם. ברגע שסיימנו את התכנון הזה יצאנו לדרך, והמערכות החדשות הגיעו בתחילת השנה, ינואר 25. עד אפריל, כבר היינו בסיומו של הפרויקט, ולמעשה קיצרנו את לוח הזמנים בזכות העבודה של הצוותים של מנורה ואנשי השטח. כאן שוב הוכח, איך שיתוף פעולה מצד הלקוח אפשר לא רק להצליח בפרויקט אלא גם לתת ערך מוסף והבנה של הלקוח בתשתיות הקיימות אצלו".

 איפה נפילת הטיל תפסה אתכם?

"המבחן היה כאשר החליטו לדלג. נתתי התרעה לצוותים שיהיו מוכנים, כדי לסייע. הדילוג הצליח ברמה כזו, שבשלב מסוים בערב, שאלתי אם פנו אליהם ממנורה, והם אמרו שלא, שהם למעשה לא זקוקים לעזרה שלנו, וזה לדעתי המבחן הכי טוב. תוך ארבעה חודשים הלקוח הגיע לרמת הבנה כזו של התשתיות הפעולות אצלו והצליח לתפעול תהליך לא פשוט טכנולוגית באופן עצמאי ובלתי תלוי בספקים חיצוניים. זו בעיני הצלחה".

איך הבינה המלאכותית השתלבה בפרויקט הזה בעצם?

"יכולות מובנות במערכות האחסון החדשות של IBM DS8K Gen 10 מגיעות עם יכולות זיהוי אנומליות מובנות בדיסקים ותרחישי שינוי מידע שעלולים להצביע על תקיפות כופרה פוטנציאליות מסומנים בזמן אמת על ידי AI שרצה בתוך הדיסקים. מדובר בטכנולוגיה ייחודית של יבמ בעולמות האחסון.

יניב, לסיום, מה האתגר הבא?

"לא חסרים אתגרים, אבל המרכזי זה האבטחה, אנחנו גוף שמחזיק בהרבה מאוד מידע קריטי על לקוחות, והמשימה העליונה היא לשמור על המידע, למנוע התקפות ולמנוע הונאות. יש גם את האתגר של איך אנחנו מנגישים את המידע בצורה יותר יעילה. אגב AI וזה נושא שאנחנו עובדים עליו".

להאזנה לפרק המלא.

תגובות

(0)

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אין לשלוח תגובות הכוללות דברי הסתה, דיבה, וסגנון החורג מהטעם הטוב

אירועים קרובים