GTC 2024: מהן ההכרזות המרכזיות של אנבידיה בכנס השנתי?

הכנס - שנערך בימים אלו בסן חוזה שבקליפוניה, בנוכחות קהל גדול של אנשי תעשייה, מפתחים וחוקרים - הוא האירוע הפיזי הראשון במה שהחברה מכנה "עידן ה-AI", וההכרזות - בהתאם

ארכיטקטורת Blackwell החדשה של אנבידיה.

אנבידיה (NVIDIA) לא מתכוונת לחכות לאף מתחרה, והיא מתכוונת להמשיך לשלוט בשוק הבינה המלאכותית, בעיקר עם פתרונות חומרה, כל עוד היא תוכל לעשות את זה. ב-GTC 2024 שנערך בסן חוזה – הכנס בנוכחות פיזית הראשון שעורכת החברה מזה חמש שנים – היא שוב הפגינה "שרירים" עם דור חדש של מוצרי בינה מלאכותית המבוססים על ארכיטקטורה חדשה שעונה לשם Blackwell. לפי החברה, מעבדי Blackwell מיועדים לדור הבא של מודלי הבינה המלאכותית המבוססים על 'תערובת של מומחים'.

"במשך שלושה עשורים אנחנו מובילים את פיתוח יכולות המחשוב המואץ, במטרה להניע פריצות דרך כמו לימוד מעמיק ובינה מלאכותית. בינה מלאכותית יוצרת היא הטכנולוגיה המגדירה את זמננו. מעבדי ה-Blackwell הם המנוע שמניע את המהפכה התעשייתית הזו. בעבודה משותפת עם הארגונים הדינאמיים ביותר בעולם, נממש את ההבטחה של ה-AI בכל תעשייה", אמר ג'נסן הואנג, מייסד ומנכ"ל החברה, במהלך הנאום שפתח את הכנס.

קפיצה נחשונית עם מעבדי Blackwell

ההתקדמות באה לידי ביטוי בקפיצה שאפשר להגדיר כנחשונית במקרה של מעבדי ה-Blackwell, שמציעים יכולת עיבוד של 20 PetaFLOPS בשבב גרפי יחיד, עם יכולות שמאפשרות לבצע אימון מודלים במהירות שגדולה עד פי ארבעה לעומת הדור הקודם, עם ביצועי היסק שיכולים להגיע לעד פי 30, ולעשות את כל זה ביעילות אנרגטית של עד פי 25 לעומת המעבדים הקודמים.

המעבדים החדשים מבוססים על הדור השני של מנוע ה-Transformer, אותו הציגה החברה בשנה שעברה. הם מורכבים מ-208 מיליארד טרנזיסטורים, ומיוצרים בליתוגרפיה של 4 ננו-מטר ב-TSMC, באופן מותאם שבמסגרתו שני שבבים גרפיים מחוברים בחיבור שבב-אל-שבב במהירות 10 טרה-בייט/לשנייה, כדי ליצור מעבד גרפי אחד.

הם גם משלבים את הדור החמישי של קישורי ה-NVLINK, שמאפשרים כעת לחבר זה לזה ביעילות עד 576 במקביל – וכן מאפשרים לבנות דטה סנטרים שיכולים להכיל כבר מעבד ל-100,000 מעבדים בשרתים שמחוברים זה לזה, וזאת עבור דור חדש של מודלים שיכולים להתייחס לשדה בינה מלאכותית שמכיל טריליון משתנים.

NVL72 של אנבידיה.

NVL72 של אנבידיה. צילום: יח"צ

"מתקדמים אל מולטי מודלים שמשלבים מומחיות שונות"

"אנחנו נמצאים בהתקדמות בקצב מסחרר של הבינה המלאכותית, שהגיעה לשיאה בשנה שעברה עם הבינה המלאכותית יוצרת התוכן, והיכולת של המודלים השתפרה כבר שוב מאוד, ובאופן משמעותי, ועכשיו אנחנו מתקדמים אל מולטי מודלים שמשלבים מומחיות שונות – מודלים שמתמחים כל אחד בתחומו, ויחד מייצרים תשובות יותר טוב למשתמשים הסופיים. אפשר לחשוב על זה כמו על קבוצה של מומחים ששולחים ומקבלים דוא"ל בזמן אמת, בינם לבין עצמם, יחד, ומייצרים תגובות ותבונות בזמן אמת", אמר עמית כץ, סמנכ"ל מוצרי הרשת של אנבידיה בסניף ישראל, בתדרוך עיתונאים.

"אנחנו רואים דרישה מוגברת לעוצמת חישוב, ואסור גם לשכוח שצריכים להתמודד גם עם מודלים של היסק עם דרישה לזמן אמת, ועם קלט עצום של כמויות מידע שדורשות יכולות של חישובי מיליארדי משתנים, וזה אומר שצריכים להמשיך לפתח דברים חדשים, ובכל שנה אנו מציגים התקדמות, והשנה היא עצומה", הוא הוסיף.

הדור החדש של NVLink, שכמו מוצרי התקשורת האחרים של החברה מפותח בעיקר בישראל, מציע גם מתגים חדשים שבפני עצמם מאשפרים חישוב ברמה של 3.6 TeraFLOPS, כדי להוריד עומס מהמעבדים הראשיים, והוא גם מציע מהירות תעבורה שגבוהה עד פי 18 ממה שמציעים מתחרים אחרים, כך לפי החברה, והם משתלבים בין השאר ב-GB200 NVL72, שהיא יחידת מחשוב אחת לשילוב במארזים לשרתים שמכילה 36 מעבדי Grace, שכל אחד מהם מחובר לשני מעבדי Blackwell, ולמערך מיתוג מלא שמבוסס על NVLink, בתוך מארז בקירור נוזלי כדי לחסוך בהוצאות הקירור – ועם עוצמת מחשוב בינה מלאכותית ברמה של 720 PetaFLOPS עבור תרחישי אימון, ועד 1,440 PetaFLOPS עבור תרחישי היסק, עם מרחב שדה של עד 27 טרה משתנים.

המתגים החדשים של אנבידיה שפותחו בישראל.

המתגים החדשים של אנבידיה שפותחו בישראל. צילום: יח"צ

Quantum-X800 – פותח בישראל

החברה גם הכריזה על מוצרי תקשורת חדשים לדור המחשוב המואץ, בדמות Quantum-X800 InfiniBand לתשתיות AI ייעודיות, ו-Spectrum-X800 Ethernet עבור תשתיות דאטה סנטר שמותאמות לעידן הבינה המלאכותית, שפותחו, כמו הדורות הקודמים של מוצרי התקשורת של החברה, במרכז שלה בישראל. Quantum-X800 נמצא בבסיס של ConnextX-8 SuperNIC, שמציע עוצמת מחשוב מובנית של 14.4 TeraFLOPS, עם 144 חיבורי 800 גיגה-ביט/לשנייה ועם זמן שיהוי קצר במיוחד.

אבל לא רק חומרה חדשה הוצגה במסגרת היום הראשון של GTC 2024. החברה הציגה גם מגוון פתרונות תוכנה, שאחד מהם, NIM, הוא מערך מיקרו שירותים המשתמש ב-API תקניים לתעשייה ומציע תמיכה של מודלים מותאמים ומנועי היסק ממוטבים, כדי לאפשר לארגונים, במסגרת חבילת NVIDIA AI Enterprise 3.0, לבנות פתרונות בינה מלאכותית יוצרת במהירות, על בסיס מנוע ה-CUDA המסורתי של החברה.

כן הציגה החברה מודל בסיסי בשם GROOT שיהיה בסיס לפיתוח של רובוטים דמוי אנוש, וכן פיתוחים של הפלטפורמה הרובוטית Issac, שמיועדים לשימוש ברובוטים תעשייתיים מבוססי זרועות, וכן עבור רובוטים בעלי יכולת ניוד עצמית ברצפת הייצור ובמחסנים.

כן הכריזה החברה על הבאת פלטפורמת האומניברס שלה אל משקפי המציאות המעורבת Vision Pro של אפל, עם API שהמטרה העיקרית שלהם היא לבנות תאומים דיגיטליים תעשייתיים וכדומה, שניתן יהיה לבחון באמצעות פתרון ה-3,500 דולר של אפל.

במקביל להכרזות של אנבידיה על פתרונות החדשים שלה בעולם הבינה המלאכותית, הוכרזו בכנס גם כמה שיתופי פעולה עם יצרניות המחשוב שבאקו-סיסטם שלה. כך, לדוגמה, יחד עם דל הכריזו החברות על Dell AI Factory with NVIDIA – פתרון מקצה לקצה, המשלב את יכולות המחשוב, האחסון, הקצה, התוכנה והשירותים של דל עם תשתית הבינה המלאכותית וחבילת התוכנה המתקדמת של אנבידיה. כן הציגה החברה, יחד עם VMware, את VMware Private AI Foundation. שתי החברות מציעות כאן את המיקרו-שרתים של פתרון ה-NIM החדש, שעליו הוכרז אתמול בהיבטים השונים שלו, כולל היסק ומודלים של בינה מלאכותית, וכן עם שיתוף של מודלים צד שלישי, תחת רישיון הבינה המלאכותית הארגוני של אנבידיה.

תגובות

(0)

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אין לשלוח תגובות הכוללות דברי הסתה, דיבה, וסגנון החורג מהטעם הטוב

אירועים קרובים