"לא צריך 'למבורגיני' עבור כל משימת AI"

עמרי נצר, קבוצת יעל: "ל-AI יש תג מחיר - מנמ''רים נדרשים לניווט חכם בין הפריזמה הפיננסית והחלטות טכנולוגיות"

עמרי נצר, סמנכ"ל FinOps ומעבר לענן בחטיבת All Data בקבוצת יעל.

"מאז ש-GenAI פרצה לחיינו בסערה, ארגונים מאמצים שירותי בינה מלאכותית יוצרת בקצב חסר תקדים. אלא שמבנה העלויות של AI מורכב מאוד וההוצאה על AI, לרוב, אינה מתורגמת לערך עסקי ממשי. כדי למקסם ערך עסקי, הכרחי לייצר שיתוף פעולה הדוק בין צוותי הפיתוח, הדאטה והפיננסים בארגון – ולהפוך את העלויות לעוד 'משקפיים' באמצעותם שוקלים בחירות טכנולוגיות. לא צריך 'למבורגיני' עבור כל משימת AI", כך אמר עמרי נצר, סמנכ"ל FinOps ומעבר לענן בחטיבת All Data בקבוצת יעל (Yael Group).

לדברי נצר, "גרטנר (Gartner) צופה כי ההוצאה הגלובלית על GenAI תעמוד השנה על 644 מיליארד דולר – צמיחה של כ-76% לעומת 2024. אבל מחקר של מק'ינזי (McKinsey) מצא שרק 10-20 אחוזים מניסויי ה-AI של ארגונים הניבו ערך עסקי. בשל החלטות שגויות לגבי השקעות טכנולוגיות, ארגונים מאבדים כ-30% ממה שהשקיעו".

הצורך ב-FinOps לניהול מושכל

"נדרש למקסם ערך עסקי", הסביר נצר. "בלא לשלב תהליכי FinOps בשימושי AI, ארגונים לא יצליחו להבטיח החזר על השקעה. ההשקעה שמתחילה במרבית המקרים ב-PoC (בחינת היתכנות) קטן, עלולה לצאת משליטה. חסרה בארגונים הבנה עמוקה של תהליכי FinOps".

לדבריו, "מודלי AI מכניסים שפה חדשה גם לתחומי השימושים והעלויות. שירותי AI מבוססים על 'טוקנים' – 'מטבע' חדש שבו 'משלמים' על פיסות מידע שהמודל קולט או פולט, הדורשים 'דלק' יקר בדמות משאבי עיבוד ואימון יקרים (GPUs). בנוסף, פיתוחי AI כרוכות בניסויים, לעיתים בתהליך מחזורי עתיר השקעות באימון מודלים. אם הן מצליחות ועוברות לייצור – העלויות עלולות לחרוג מהמתוכנן".

"בניית המענה", הדגיש נצר, "צריכה לכלול מקסום ערך עסקי, שבו משתמשים טכניים יבינו את המשמעויות הכספיות של הבחירות הטכנולוגיות שלהם, ומנגד – אנשי פיננסים יבינו את היעדים והצרכים של פרויקטי AI. כשעושים שימוש ב-AI בענן הציבורי, יש ליצור הליך קבלת החלטות מושכל ומונע בזבוז".

יש לבחור אותו בהתאמה למשימה הנדרשת. מודל השפה הגדול - LLM.

יש לבחור אותו בהתאמה למשימה הנדרשת. מודל השפה הגדול – LLM. צילום: Shutterstock

"על תשובות מיידיות משלמים יותר"

"בכל פרויקט חיוני לשאול את השאלות הנכונות: האם אנחנו משתמשים במודל הנכון למשימה", או כפי שהסביר זאת – לא כל תרחיש דורש למבורגיני. וא הוסיף והסביר כי "בחירה במודל זול שעונה על הצורך עשויה לחסוך הון. לדוגמה, באותו תרחיש שימוש, מודל Claude 4 Opus יעלה יותר מ-41 דולר למיליון טוקנים, בעוד שמודל Claude 4 Sonnet יעלה רק 8.3 דולר למיליון טוקנים".

עוד ציין נצר: "האם אנחנו באמת צריכים מענה בזמן אמת? על תשובות מיידיות משלמים יותר. עבור משימות שאינן דחופות, שימוש במנגנון עיבוד Batch מאפשר לייעל את צריכת המשאבים ולהציע חיסכון משמעותי של עד 50% לעומת שימושים בזמן אמת. עוד חשוב לברר האם יש שאילתות שחוזרות על עצמן – חלק גדול מהשאילתות בתהליך חוזרות ואין צורך לעבד שוב ושוב את אותו מידע. שימוש במנגנון Cache מאפשר לחסוך מעל 70% בעלויות".

לדבריו, "שתי שאלות נוספות שיש להעלות הן: האם באמת צריך לאמן מודל? זהו תהליך ניסויי שעלול להוביל להשקעות גדולות שלא לצורך. לעיתים אפשר להימנע מכך באמצעות אימון הדרגתי – השקעות נוספות מתבצעות רק לאחר בדיקת התאמת המודל. כך ניתן לחסוך פעולות אימון ממושכות ויקרות. בנוסף, האם אנחנו מתכננים נכון לעתיד? מודלי AI מתפתחים כל העת, ובכל מודל חדש משתנים המחירים והיכולות. לכן, בעת שדרוג מודל או המשך שימוש במודל קיים, יש לקחת בחשבון עלויות. לצמצום עלויות נדרש תכנון נכון של אופן השימוש, ניצול היכולות והכלים שמציעות ספקיות הענן ובניית תהליכי עבודה המאפשרים מעבר פשוט ומהיר בין מודלים".

"אנחנו עוברים למציאות שבה GenAI משנה לחלוטין את הסביבה הטכנולוגית שלנו", סיכם נצר. "בגלל מורכבות השירותים בתחום ומודלי השימוש שלהם, שימוש מושכל בהם מחייב לא רק הבנה טכנולוגית אלא גם יישום של גישת FinOps, המאפשרת למקסם את הערך העסקי מהמהפכה הטכנולוגית השוטפת את העולם".

תגובות

(0)

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אין לשלוח תגובות הכוללות דברי הסתה, דיבה, וסגנון החורג מהטעם הטוב

אירועים קרובים