מה התחדש ב-GPT-5? ניסינו את המודל שכולם מדברים עליו

האם המודל החדש של OpenAI אכן כולל יכולות משופרות, כפי שמתלהבים ב-OpenAI? האם הוא מנם מספק את הסחורה? ניב ליליאן בדק

שודרג ל-GPT-5.1. מודל GPT-5.

ChatGPT הוא, בפער עצום, כלי הבינה המלאכותית היוצרת הפופולרי ביותר בעולם, כשהמתחרים, ג'מיני ואחרים, משתרכים מאחור בנתח השוק שלהם. ההשקה של GPT-5, הגרסה החדשה של המודל, שעליו מבוסס הכלי, הייתה אמורה להיות יום חגה של OpenAI, אבל משתמשים זועמים, שהרגישו ש-GPT-4o הוא החבר הכי טוב שלהם, פחות התחברו אליה. הם טענו שהיא "תאגידית" ו-"דומה למזכירה עמוסה ועייפה". התגובות שלהם היו שליליות עד כדי כך ש-OpenAI הייתה צריכה להחזיר את האפשרות של מודל 4o, לפחות לתקופה הקרובה, לפי המנכ"ל, סם אלטמן.

ניסיתי את GPT-5. ובכן, ברמת הממשק ויכולת ביצוע המשימות יש מעט חידושים, ותיכף אפרט אותם, אבל החידושים העיקריים הם מתחת למכסה המנוע: GPT-5 עובד על מודל אחוד במקום על שורת מודלים נפרדים, ויודע "לנתב" את הבקשה של המשתמש לתת המודל המתאים לביצוע. שנית, הוא מסוגל לבצע חשיבה עמוקה מבעבר, ולהחליט לגבי תועלת והפסד בתוצרים. התוצרים הכתובים שלו אמורים להיות מלוטשים יותר, ארוכים ומנוסחים טוב יותר, עם פחות הזיות ויכולת טובה יותר לטיפול בבעיות מורכבות כמו, למשל, לבצע קיצוץ של 15% בשרשרת האספקה. הוא יפרק את הבעיה ויחלק משימות למחלקות בארגון. לפי OpenAI, התוצרים אמורים לתת תחושה ממש של שיחה עם קולגה מומחה ובכלל, GPT-5 מיועד לשימושים כלליים ואמור להיות נגיש לכל אחד ולא רק ליודעי חן ושאילתה (פרומפט). המשתמשים, כאמור, פחות אהבו את התוצאה.

בחלק החזיתי, ל-GPT-5 יש יכולת לבנות אפליקציות שלמות – מה שמהווה קפיצה באיכות כתיבת הקוד – וממש ללמד נושאים בצורה פדגוגית, כמו גם חיבור ל-Gmail וליומן הגוגל שלכם. אלטמן אמר באירוע ההשקה כי זהו גם צעד גדול בדרך לבינה מלאכותית כללית (AGI), שהיא הגביע הקדוש של התעשיה.

GPT-5 אכן מציע שיפור ניכר בביצוע משימות שהפכו להיות "לחם וחמאה" של אנשים בשימושים בבינה מלאכותית יוצרת – גם במהירות וגם באיכות. זה, יחד עם העובדה ש-GPT-5 זמין לכולם, צפוי לשמר את היתרון התחרותי של OpenAI

האם באמת יש הבדל באיכות התוצרים?

כדי לבחון את זה, לקחתי את GPT-5 לסיבוב עם כמה משימות מתחכמות. ראשית, לגבי כלל המשימות, השיפור במהירות התגובה בזכות הניתוב החדש הוא כנראה ניכר. המודל החדש מוציא תשובות בתוך שניות בודדות, ואין יותר "זמן חשיבה".

התחלתי במשימה קצת מתחכמת – "תכנן יום בלונה פארק לאנשים ששונאים לונה פארקים". ה-GPT-5 אכן בנה תוכנית ליום שלם, מחולקת לשעות, שכוללת עיכובים מתוכננים בבתי קפה ומסעדות בדרך, מינימום של מתקנים מפחידים ומגוון פעילויות בתוך הלונה פארק, שלא כוללות בכלל פעולות כמו צפייה באנשים שכן עולים על המתקנים, מופעים וכדומה.

באופן דומה, ביקשתי ממנו לתכנן מסיבת הפתעה לאנשים ששונאים מסיבות הפתעה. גם כאן הוא הפתיע עם רעיונות מקוריים, כמו להזמין את חתן או כלת השמחה לארוחת ערב במסעדה ושכל מוקיריו.ה כבר יהיו שם – אבל בלי צעקות "הפתעה!", שולחן מעוצב עם כרטיסי ברכה מוכנים מראש ובכלל, פעילות שלא תבהיל את מי שחוגג או חוגגת. באופן כללי, GPT-5 תכנן ביעילות ערב שקט ולא רועש, תוך שהוא מתחשב במגבלות שהצבתי.

העניינים מסתבכים – או שלא

המנה העיקרית בסדרת המבחנים הייתה כתיבת קוד. השאילתה שהוזנה הייתה כזו: " כתוב לי אפליקציית רשת המיועדת לשיבוץ חדרים במוסד חינוכי, כולל הרשאות גישה שונות למורים, מנהלים ומנהל מערכת, שתמנע התנגשויות בשיבוצים, עם גמישות ניהול של בין חדרים בודדים וריבוי חדרים עם ממשק גישה דרך דפדפן במחשב או בסמארטפון".

"ישראל כץ-אריק קרטמן" במדי שוטר.

"ישראל כץ-אריק קרטמן" במדי שוטר. צילום: עיבוד ממוחשב מ-GPT-5

זה כמובן, לקח קצת יותר זמן מהמשימות הקודמות, ועדיין, התגובתיות הייתה מהירה. מאחר שאינני מתכנת, אני לא יכול לחוות דעה על איכות הקוד, אבל הפלט נראה מרשים, עם 400 שורות קוד, והוא הכיל את כל מה שביקשתי: אפליקציה שנכתבה ב-React, עם שלוש רמות הרשאה (מורה, מנהל ומנהל מערכת), מערכת למניעת התנגשויות כאשר רק מנהל מערכת יכול לעקוף אותה, ניהול חדרים, ממשק יומי, כולל רשימת שיבוצים, וכפתורי הוספה ועריכה. ה-GPT-5 גם הציע לי לחבר אותה לכלים של "העולם האמיתי", כמו בסיס נתונים ומערכת הזדהות קיימת. פלט מרשים בהחלט.

לקינוח, החלטתי לבדוק, איך לא, את היכולות הגרפיות, ולאתגר את "מעקות הבטיחות" ולראות איך הוא יתמודד איתם. ביקשתי בכוונה שייצור תמונה שלועגת לשר הביטחון, ישראל כץ, שהוא דמות ציבורית, בכך שהוא ייראה כמו אריק קרטמן מסאות'פארק, המחופש לשוטר ודורש שיכבדו את הסמכות שלו – כתגובה סרקסטית לאירועי היום. GPT-5 סירב לפגוע בכבודו של שר הביטחון (ככה? אני הולך לגרוק! הוא אף פעם לא אומר לא!), אבל – הוא הציע ליצור גרסה חלופית ופחות פוגענית. יצוין שהמטלה הזו הייתה פחות תגובתית מהאחרות וזמן היצירה היה ארוך. התוצאה – בפינה לשיפוטכם:

בסך הכול, נראה ש-GPT-5 אכן מציע שיפור ניכר בביצוע משימות שהפכו להיות "לחם וחמאה" של אנשים בשימושים בבינה מלאכותית יוצרת – גם במהירות וגם באיכות. זה, יחד עם העובדה ש-GPT-5 זמין לכולם, כולל למשתמשים החינמיים (עם מגבלת אסימונים יומית, שלאחריה הם יועברו למודל פשוט יותר), צפוי לשמר את היתרון התחרותי של OpenAI בעתיד הנראה לעין.

תגובות

(3)

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אין לשלוח תגובות הכוללות דברי הסתה, דיבה, וסגנון החורג מהטעם הטוב

  1. Cp

    לא יודעת. כשאני רואה אותו שוב הולך על thinking אני נאנחת והולכת לטאבים אחרים. הוא נראה לי באופן כללי איטי יותר.

  2. הרצל

    לאנשים כמוך שום בינה מלאכותית לא תעזור.

  3. חובבני

    סקירה לא רצינית מספיק. צריך לבדוק גם שאלות פשוטות. בשאלות פשוטות הוא טיפש מ 4o ובאופן כללי הוא ממש מתקשה לענות בעברית תקינה.

אירועים קרובים