האם דיפסיק אמנם השקיעה שישה מיליון דולר בלבד באימון המודל?

התשובה היא לא - כך לפי חברת המחקר SemiAnalysis ● הסכום הזה, לדבריה, הוא עלות ראשונית בלבד ● אז מה העלות האמיתית, ומה היא כוללת?

יצרה אפקט שמשפיע על תחום ה-GenAI. דיפסיק.

אחד הטיעונים החזקים ביותר של דיפסיק – וכנראה זה מה שגרם לטלטלה בשווקים ולירידת הערך העצומה אך הזמנית של אנבידיה – הוא שמודל הבינה המלאכותית היוצרת V3 שלה מציע ביצועים שווים ואף טובים יותר מהמתחרות, בעלות זולה בהרבה. לטענתה, בעוד שהמתחרים שילמו מאות מיליוני ואף מיליארדי דולרים, היא הוציאה על המודל שישה מיליון דולר בלבד.

אבל, פחות משבועיים לאחר תחילת הסערה, ומעבר לשאלות הכבדות לגבי איכות שמירת הנתונים בשרתים בסין, התחילו לצוץ טענות שלפיהן דיפסיק לא סיפקה פרטים אמיתיים על המודל. אחת המרכזיות שבאותן טענות הובילה לבדיקה שהחל לבצע הממשל האמריקני החדש – האם החברה השתמשה במעבדי H100 של אנבידיה ולא במעבדים המוחלשים והזולים הרבה יותר?

ועכשיו, חברת המחקר העצמאית SemiAnalysis שמה על הכוונת שלה את עלות הפיתוח הזולה, לפי הטענות של אנשי דיפסיק. היא השוותה ביניהן לבין טכנולוגיות מתחרות בשוק, כדי להבין את מבנה העלויות והאם החברה מסרה נתונים מדויקים על עלויות אימון המודל שלה. המסקנה שלה היא שלא.

המחקר: העלויות של דיפסיק גבוהות בהרבה

לפי הניתוח של SemiAnalysis, העלות שדיפסיק מסרה – שישה מיליון דולר – היא סכום ראשוני בלבד. כך, ההוצאה הכוללת של החברה על שרתים (CapEx) מסתכמת ב-1.6 מיליארד דולר – יותר מפי 215 ממה שהחברה מספרת. רוב ההוצאה נובעת מהצורך לתפעל ולתחזק את אשכולות הכרטיסים הגרפיים הגדולים שלה – עמוד שדרה של כל חברה שעוסקת בתחום הבינה המלאכותית.

חברת המחקר מצאה שיש לדיפסיק גישה לכ-50 אלף מעבדי Hopper, וגם אם לא כולם הם מעבדי H100, כפי שחושדים בארצות הברית, התערובת בהחלט מכילה מעבדים כאלה (כ-10,000 יחידות). עם זאת, לא ניתן לדעת אם כולם נרכשו לפני שאיסור המכירה שהוטל על ידי ממשל ביידן נכנס לתוקף או אחרי. השרתים גם מכילים מעבדי H800 (כ-10,000 יחידות), גם הם של אנבידיה, שמציעים את אותה עוצמת עיבוד כמו ה-H100, אך ברוחב פס קטן יותר, וגם את מעבדי ה-H20 המוחלשים, שארצות הברית עדיין מתירה למכור אותם לחברות סיניות.

יתרה מזאת, High-Flyer, הקרן שעומדת מאחורי ההשקעה בדיפסיק, מעמידה לשימושה עוד כ-10,000 מעבדי A100, שהיא הספיקה לרכוש עוד לפני שהמלחמה המסחרית הגיעה לאזור של הבינה המלאכותית. כמו כן, המחקר מעלה ש-High-Flyer כבר הזמינה מאנבידיה עוד הרבה מאוד מעבדי H20.

לפי הניתוח של SemiAnalysis, הוצאות התפעול המוערכות של הדאטה סנטרים של החברה הסינית מגיעות ל-945 מיליון דולר, ועלות הבעלות הכוללת על טווח של ארבע שנים מגיעה כבר ל-3.57 מיליארד.

בדו"ח נכתב ש-"כפי שמראה ההיסטוריה, סטארט-אפ קטן, שממומן היטב וממוקד, יכול, לעתים קרובות, לדחוף את הגבולות של מה שאפשר להשיג. לדיפסיק אין צורך להתמודד עם ביורוקרטיה כמו גוגל, לדוגמה, ומכיוון שהיא ממומנת בעצמה, היא יכולה לעבוד במהירות על רעיונות. עם זאת, כמו גוגל, דיפסיק (לרוב) מפעילה דאטה סנטרים משלה, מבלי להסתמך על גורם או ספק חיצוני. זה פותח קרקע נוספת לניסויים, ומאפשר לאנשיה ליצור חידושים".

"מצביעים על חלק מסוים ומציגים אותו כעלות הכוללת"

לגבי טענת השישה מיליון דולר, בחברת המחקר טוענים שמדובר בעלויות ראשוניות בלבד. "העלות של שישה מיליון דולר מיוחסת רק לעלות המעבדים בהרצת הקדם-אימון, וזה רק חלק מהעלות הכוללת של המודל. זה לא כולל חלקים חשובים מהפאזל כמו המחקר והפיתוח ועלות הבעלות הקודמת של החומרה עצמה. כדי לסבר את האוזן, Claude 3.5 Sonnet עלה 10 מיליון דולר לאימון, ואם זו הייתה העלות הכוללת שנדרשה לאנת'רופיק, היא לא הייתה מגייסת מיליארדים מגוגל ועשרות מיליארדים מאמזון. זה מאחר שהיא צריכה להתנסות, להמציא ארכיטקטורות חדשות, לאסוף ולנקות נתונים, לשלם לעובדים ועוד הרבה יותר", הסבירו החוקרים.

"זה (הצגת הסכום של שישה מיליון דולר – צ"ק) שגוי. זה דומה להצבעה על חלק מסוים בכתב חומרים עבור מוצר ולייחסו כעלות כולה. עלות ההכשרה המוקדמת היא חלק צר מאוד מהעלות הכוללת", סיכמה SemiAnalysis.

תגובות

(0)

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אין לשלוח תגובות הכוללות דברי הסתה, דיבה, וסגנון החורג מהטעם הטוב

אירועים קרובים