אנת'רופיק השיקה את "מודל הקידוד הטוב בעולם"
Claude Sonnet 4.5 יכול לקודד עצמאית 30 שעות ברציפות ● לדברי אנת'רופיק - המודל קובע רף חדש בביצועי תוכנה בעולם האמיתי, גובר על מתחרים מובילים במבחני קידוד, ומביא יכולות מתקדמות לתחומי הפיננסים והסייבר
חברת אנת'רופיק (Anthropic) השיקה את הגרסה העדכנית ביותר של מודל הבינה המלאכותית המרכזי שלה, Claude Sonnet 4.5, אותו היא מתארת כ"מודל הקידוד הטוב ביותר בעולם". לפי החברה, מדובר במודל שמספק קפיצת מדרגה ביכולת של המודלים דוגמתו לבצע משימות מורכבות. Sonnet 4.5, כך דווח, מפגין ביצועי קידוד מתקדמים ויכולת ליצור יישומים שכבר מוכנים לפעולה בסביבת ייצור (Production-ready). עוד ציינה החברה כי מודל קלוד החדש מציג שיפורים משמעותיים גם בתחומים של מתמטיקה, חשיבה ושימוש במחשבים.
30 שעות קידוד אוטונומי
אלא שכבר ניתן להבין כי ההישג הבולט ביותר של Sonnet 4.5 הוא יכולתו יוצאת הדופן לטפל במשימות ארוכות טווח באופן אוטונומי.ץ לפי אנת'רופיק הוא מסוגל לשמור על ריכוז בביצועיו במשך יותר מ-30 שעות של קידוד רציף. יכולת זו מרמזת על הגשמת ההבטחה לפיתוח מעין "עמית לעבודה" מבוסס AI. כהדגמה להיותו כזה, קלוד החדש הצליח לבנות מחדש את יישום האינטרנט של Claude.ai עצמו בתוך כחמש שעות וחצי, תוך שימוש בלמעלה מ-3,000 קריאות לכלים שונים.
אנת'רופיק מבדלת את המודל באמצעות התמחויות, בייחוד בתחומי הקידוד והפיננסים. ולפי הדיווחים, המודל עקף את מודל הדגל הקודם שלה, Opus 4.1, בכמה תחומים, כולל בפתרון בעיות בתעשיית השירותים הפיננסיים.
בהודעה הרשמית של אנת'רופיק צוין כי: "זהו מודל ה'פרונטיר' (Frontier model) העקבי ביותר שהשקנו אי פעם, עם שיפורים משמעותיים בהיבטים רבים בהשוואה לגרסאות קודמות של קלוד".
מבחינת בטיחות ויישור (Alignment), המודל החדש מוגדר כמודל ה'פרונטיר' "המיושר ביותר" ששוחרר עד כה. לפי החברה Sonnet 4.5 כוונן כדי לצמצם התנהגויות מטרידות כמו שאיפות כוחניות או עידוד חשיבה כוזבת.
מחיר השימוש ב-Sonnet 4.5 נותר זהה לזה של Sonnet 4: שלושה דולר למיליון טוקני קלט ו-15 דולר למיליון טוקני פלט.
📣 Claude Sonnet 4.5, Anthropic’s most advanced model for coding and real-world agents, is now rolling out in GitHub Copilot to Copilot Pro, Pro+, Business, and Enterprise ⬇️https://t.co/iJyz9EKAPu pic.twitter.com/aaoEya50yN
— GitHub (@github) September 29, 2025
התלהבות ניכרת בחוות הדעת וביצועי מבחנים טובים
במבחני ביצועים, כך דווח, המודל כבר מיצב את עצמו כמוביל בתעשייה. במבחן SWE-Bench Verified – הבודק כישורי קידוד בסביבות תוכנה אמיתיות באמצעות בקשות שחזור (Pull requests) מ-GitHub, המודל הגיע לתוצאה של 77.2% (ועד 82% עם יכולות חישוב מקביליות).
כמו כן, במבחן OSWorld – המדמה משימות שימוש במחשב בעולם האמיתי – Sonnet 4.5 נמצא מוביל עם שיעור הצלחה של 61.4%. זהו שיפור משמעותי לעומת Sonnet 4, שהגיע ל-43.9%.
נשיא חברת ריפליט (Replit), מיקלה קטסטה, ציין כי יכולות העריכה של המודל "יוצאות דופן", ואמר: "ירדנו משיעור שגיאות של 9% ב-Sonnet 4 לאפס אחוז במבחן עריכת הקוד הפנימי שלנו". מייקל טרואל, מנכ"ל Cursor, אישר כי גם בחברה שלו זיהו ביצועי קידוד "ברמה הגבוהה ביותר" של המודל החדש. גם שון וורד, מנכ"ל ומייסד-שותף ב-iGent AI, הדגיש את השפעת האוטונומיה וציין כי "Claude Sonnet 4.5 איפס את הציפיות שלנו – הוא מטפל בלמעלה מ-30 שעות של קידוד אוטונומי, ומפנה את המהנדסים שלנו לטפל בחודשים של עבודות ארכיטקטורה מורכבות בפחות זמן, תוך שמירה על עקביות על פני מאגרי קוד עצומים".
Claude Sonnet 4.5 is available everywhere today—on the Claude Developer Platform, natively and in Amazon Bedrock and Google Cloud's Vertex AI.
Pricing remains the same as Sonnet 4.
For more details: https://t.co/KLeHxELpBF pic.twitter.com/QHf1Dnao8w
— Claude (@claudeai) September 29, 2025
מה עוד התחדש באנת'רופיק?
לצד המודל, אנת'רופיק עדכנה את סל מוצרי קלוד שלה עם מספר חידושים שהציגה ובהם:
- Claude Agent SDK: ערכת כלים חדשה שנועדה לאפשר למפתחים לבנות סוכני AI על אותה תשתית שמשמשת את Claude Code. ערכה זו כוללת תכונות כמו ניהול זיכרון וניהול הקשר.
- Claude Code: קיבל את תכונת 'Checkpoints' – המאפשרת למשתמשים לשמור התקדמות ולחזור למצב קודם בקלות. כמו כן, הושקה הרחבה מקומית עבור Visual Studio Code המציגה שכעת ינויים בזמן אמת.
ניסוי חדש: החברה השיקה גם ניסוי מחקרי זמני בשם Imagine with Claude – שבו המודל מייצר תוכנות וממשקי משתמש בזמן אמת, ללא קוד מוכן מראש, ומגיב לדרישות המשתמשים. ניסוי זה זמין למנויי Claude Max למשך חמישה ימים בלבד.











תגובות
(0)