האם המפלצת רוסנה? אנת'רופיק שחררה לציבור גרסת מיתוס "בטוחה"

אחרי חודשים של חשש עולמי מיכולות הסייבר של 'מיתוס', שעלולות להתגלגל אל ה"רעים", החברה הוציאה את 'פייבל 5' - גרסה מוגנת ומתקדמת של ה-LLM, הכוללת מנגנוני ניתוב ייחודיים שחוסמים אוטומטית פקודות מסוכנות

שוחרר בגרסה בטוחה כ-'פייבל 5'. מודל 'קלוד מיתוס' של אנת'רופיק.

חברת אנת'רופיק (Anthropic) השיקה את מול לציבור הרחב את 'קלוד פייבל 5' (Claude Fable 5), המודל המתקדם ביותר שלה שזמין כעת לכלל המשתמשים. מודל זה שייך למשפחת מודלי הקצה 'מיתוס' (Mythos), שעד כה נשמרה תחת מעטה סודיות בשל חששות כבדים סביב סוגיות אבטחת סייבר שהיא מעלה.

על פי הדיווחים השונים, 'פייבל 5' מציג יכולות חסרות תקדים במשימות תכנות מורכבות ועבודות מחקר מעמיקות, ואף רשם ציון חריג של 80.3% במבחן התכנות SWE-Bench Pro.

מומחה הבינה המלאכותית אנדריי קרפתי התייחס בדיווח של TrueFoundry להשקה וציין כי "מדדי הביצועים (הבנצ'מרקים) מעולים וזה מוביל בפער בכל המדדים (SOTA), אך אוסיף שגם מבחינה איכותנית, מדובר בשינוי מדרגה משמעותי הראוי לגרסה ראשית חדשה (להערכתי, באותו סדר גודל של קלוד 4.5 בנובמבר), שמגיע לשיאו במיוחד במפגשי פתרון בעיות ממושכים של בעיות קשות מאוד. אפשר להטיל עליו משימות שאפתניות בהרבה ממה שאתם רגילים אליו, המודל פשוט 'קולט את העניין' והוא פשוט ירוץ על זה…"

מה קרה עם מיתוס עד כה? למה הוא הבהיל את כולם?

כדי להבין את גודל הבשורה, יש לחזור אחורה להכרזה המקורית על משפחת 'מיתוס' באפריל האחרון, שכפי שדיווחנו חוללה סערה בעולם הטכנולוגי והביטחוני. המודל המקורי סרק קודי מקור ואיתר למעלה מ-23 אלף פגיעויות אבטחה, כשהוא מגלה באופן עצמאי לחלוטין פרצת "יום-אפס" שהסתתרה במשך 27 שנים במערכת OpenBSD ופרצה בת 16 שנה ב-FFmpeg.

מנכ"ל אנת'רופיק, דריו אמודיי, הבהיר אז את גודל האיום כשאמר כי "סייבר הוא הסכנה המוחשית והברורה הראשונה שנשקפת ממודלי בינה מלאכותית בחזית, אך היא לא תהיה האחרונה". 

עקב כך, המודל הפתוח נשמר הרחק מהישג ידו של הציבור הרחב והגישה אליו הוגבלה למסגרת מה שכונה "פרויקט Glasswing". במסגרת פרויקט זה, קיבלו גישה למודל 'מיתוס' המקורי רק כ-200 ארגונים קריטיים ביותר מ-15 מדינות, ביניהם ברית נאט"ו (NATO), סוכנות הסייבר של האיחוד האירופי, וענקיות כגון אפל (Apple) וג'יי.פי מורגן (J.P. Morgan) – וזאת במטרה שיאתרו ויתקנו חולשות במערכותיהן, לפני שהאקרים ינצלו זאת.

האיום שהציג המודל המקורי עורר תגובות חסרות תקדים ברחבי העולם. מכון אבטחת הבינה המלאכותית בבריטניה (AISI), שבחן את המודל, מצא כי הוא מסוגל לבצע מתקפות סייבר רב-שלביות באופן אוטונומי על רשתות ארגוניות, והזהיר כי "משך משימות הסייבר שמודלים של בינה מלאכותית בחזית יכולים להשלים באופן אוטונומי הוכפל בסדר גודל של חודשים, לא שנים".

 הבהלה הגיעה גם לרגולטורים הפיננסיים, כאשר מועצת היציבות הפיננסית העולמית (FSB) החלה לאסוף מידע על הסיכונים, והבנק המרכזי האירופי קרא לבנקים להיערך בדחיפות ולתקן פגיעויות, תוך אזהרה מפורשת של חבר ההנהלה פרנק אדלרסון כי "היעדר גישה ל'מיתוס' אינו מהווה תירוץ לאי עשייה".

'פייבל 5' – נחסם מיידית לבקשות מסוכנות

לנוכח הרקע הביטחוני הרגיש, שחרורו לציבור של מודל 'מיתוס' (שזכה למיתוג מחדש בשם 'פייבל 5') דרש מנגנוני בטיחות יוצאי דופן. בפועל, 'פייבל 5' חולק את אותם משקלים טכנולוגיים עם מודל 'מיתוס 5' המסווג, אך פועל תחת הגבלות חמורות. 

על פי הדיווחים, אנת'רופיק שילבה במערכת מנגנון "ניתוב לאחור" אוטומטי, המופעל כאשר משתמש מנסה להזין שאילתות בתחומי סייבר, ביולוגיה, כימיה או זיקוק מידע רגיש. במקרים אלו, 'פייבל 5' נחסם מיידית והבקשה מנותבת למודל החלש והישן יותר, 'קלוד אופוס 4.8', שיענה במקומו. 

ניתוב זה מופעל גם כאשר המערכת מזהה ניסיונות בקנה מידה רחב של מדינות אוטוריטריות לחלץ את הטכנולוגיה של המודל. בחברת אנת'רופיק מעריכים כי ניתוב זה מתרחש בפחות מ-5% מכלל הפעלות המודל, כך שלרוב המוחלט של המשתמשים לא תהיה כל הפרעה בשימוש בו.

טרם השחרור, אנת'רופיק דיווחה כי שכרה "צוותים אדומים" של מומחים חיצוניים שהקדישו מעל ל-1,000 שעות בניסיון לעקוף את המגבלות הללו, ולצידם הופעלה תוכנית לתגמול על מציאת באגים. לטענת החברה, איש לא הצליח למצוא דרך לפרוץ לחלוטין את מנגנוני ההגנה ולשחרר את המודל. 

התלהבתם? המתינו למידע הבא – השימוש במודל העוצמתי כרוך בעלויות גבוהות במיוחד עבור המפתחים: מחירו של 'פייבל 5' עומד על 10 דולר לכל מיליון אסימוני קלט ו-50 דולר לכל מיליון אסימוני פלט – תעריף הכפול מזה של 'אופוס 4.8'. למרות זאת, ועל אף המחיר הגבוה, ההערכה היא כי היעילות החריגה של המודל הופכת אותו פעמים רבות למשתלם עבור משימות ארוכות טווח הדורשות חשיבה מורכבת.

תגובות

(0)

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אין לשלוח תגובות הכוללות דברי הסתה, דיבה, וסגנון החורג מהטעם הטוב

אירועים קרובים