עידן חדש ב-AI: סוכן ChatGPT מבצע משימות באופן אוטונומי

סוכן ה-ChatGPT של OpenAI יודע לבצע משימות מורכבות על גבי המחשב הווירטואלי שלו – מניתוח שוק ועד תיאום פגישות - ממש כמו אדם, אך ממשיך להיות בשליטת המשתמש המלאה

OpenAI השיקה באחרונה חידוש שיכול לחולל מהפכה בתחום הבינה המלאכותית. החברה הציגה את סוכן ה-ChatGPT שלה (ChatGPT agent) – אשר מעבר ליכולות שיחה והסקת מסקנות, מסוגל כעת לפעול באופן עצמאי על גבי מחשב וירטואלי משלו. על פי ההערכות מדובר בצעד משמעותי שביכולתו לשנות באופן כללי את הפרודוקטיביות הדיגיטלית של כולנו.

השקת סוכן ה-ChatGPT נחשבת לנקודת מפנה מכרעת, שכן המודל אינו מוגבל עוד לניתוח נתונים בלבד, אלא הוא מסוגל לבצע פעולות מורכבות מקצה לקצה. כפי שצוין על ידי OpenAI בהצהרתה הרשמית: "ChatGPT יכול כעת לעבוד בשבילך באמצעות מחשב וירטואלי משלו, ולנהל משימות מורכבות מהתחלה ועד הסוף, על ידי מעבר חלק בין חשיבה לפעולה".

מה עושה הסוכן?

המערכת החדשה הזו היא למעשה שילוב חכם ומתקדם של שלוש יכולות ליבה שבעבר פעלו בנפרד:

  • אופרטור (Operator) – סוכן בינה מלאכותית חלוצי של החברה, שהיה מומחה בגלישה ואינטראקציה פעילה עם אתרי אינטרנט. תחשבו עליו כעל "גולש וירטואלי" שידע ללחוץ על כפתורים, למלא טפסים ולהקליד בתוך אתרים, בדיוק כמו שאדם היה עושה.
  • דיפ ריסרץ' (Deep Research) – סוכן בינה מלאכותית אחר, שהצטיין במחקר מעמיק וסיכום של כמויות מידע גדולות ממקורות שונים כדי ליצור דו"חות מפורטים.
  • והכישרונות השיחתיים המוכרים של ChatGPT – היכולת שלו להבין שפה טבעית, לענות על שאלות ולנהל שיחות חכמות.

האיחוד של שלושת היכולות הללו יצר, לדברי OpenAI, מערכת אחת וחזקה, שבה סוכן ה-ChatGPT יכול כעת לקיים אינטראקציה מלאה עם האינטרנט בכוחות עצמו. הוא יודע לנווט באתרים מורכבים, למצוא מידע מדויק, ולבצע תהליכי עבודה שלמים ללא צורך בהתערבות אנושית בכל שלב. בהדגמה של המוצר, הובהר כי "זו הפעם הראשונה שבינה מלאכותית יכולה לבצע עבודה עבורכם על ידי שליטה במחשב משלה". כלומר, הסוכן מסוגל לבצע "כל משימה שניתן לתאר בדפדפן" – החל ממחקר נתוני שוק מקיף, דרך זיהוי תכונות ספציפיות של מוצרים, ועד לתיאום פגישות או אפילו הגשת מועמדות למשרות.

לפי הטענות של היוצרת שלו, ה-ChatGPT Agent מצויד במגוון רחב של כלים שמאפשרים לו לבצע את משימותיו ביעילות. הוא בוחר באופן אוטונומי את הכלים המתאימים ביותר למשימה, כגון דפדפן ויזואלי, ממשקי API, מסוף פקודות (טרמינל), או עורך קוד, ומשלב אותם לרצף עבודה אחד.

כמו כן, הסוכן שומר על ההקשר של המשימה לאורך כל התהליך. לדוגמה, הוא יכול לנתח מתחרים, ליצור מצגות, למלא טפסים, או לארגן נסיעות, תוך זכירת הצעדים הקודמים. הדוגמאות למשימות שהסוכן יוכל לבצע עבורכם כוללות בקשות כמו: "בדוק את היומן שלי וסכם לי את פגישות הלקוחות הקרובות על בסיס חדשות אחרונות", "תכנן ורכוש מצרכים להכנת ארוחת בוקר יפנית לארבעה", וכן "נתח שלושה מתחרים וצור מצגת שקפים".

בבדיקת מספר מדדים: ביצועי הסוכן עדיפים בהשוואה למודלים קודמים

כאמור, הכלי החדש מסוגל באופן אוטונומי לנווט בין אתרי אינטרנט, לסנן תוצאות, לבקש אימות כניסה מאובטח כשצריך, להריץ קוד, לבצע ניתוחים, ואף לספק מצגות וגיליונות אלקטרוניים הניתנים לעריכה המסכמים את ממצאיו. ואולם בחברה מדגישים כי על אף יכולותיו המתקדמות של הסוכן החכם, המשתמש נשאר בשליטה מלאה על התהליך וזאת משום שנדרש אישור מפורש לפני כל פעולה קריטית. בנוסף קיימת אפשרות להפריע למשימה או לעצור אותה בכל עת, וכן ניתן לסקור את היסטוריית הפעולות או לבצע התאמות שלהן בזמן אמת. אם משימה דורשת זיהוי או סיסמה, הסוכן עוצר ומבקש מהמשתמש להשתלט על הדפדפן הווירטואלי, מה שמבטיח שלא לכד צילומי מסך של פרטים רגישים. המערכת גם אמורה לדעת ללמוד מתוצאות פעולותיה, לשפר את גישתה ולייעל את ביצועיה לאורך זמן. בנוסף, OpenAI הטמיעה הגנות חזקות, כמו סירוב לבקשות רגישות, יישום היררכיית הוראות קפדנית והגנה מפני התקפות זדוניות.

השימוש בסוכן ה-ChatGPT מיועד הן למקרים מקצועיים – כמו למשל עדכונים אוטומטיים של דשבורדים, מידול פיננסי וכתיבה מסייעת – והן לשימושים אישיים, כגון הזמנות, תכנון וסיוע אדמיניסטרטיבי.

ב-OpenAI הציגו בגאווה בדיקות של הסוכן שנערכו על מספר מדדי ביצועים, ואלו מאשרות ביצועים עדיפים בהשוואה למודלים קודמים וובמשימות מסוימות – גם עדיפות על בני אדם בביצועים. לדוגמה, הסוכן השיג ציון של 89.9% במבחן DSBench לניתוח נתונים ו-71.3% במבחן SpreadsheetBench לגיליונות אלקטרוניים הניתנים לעריכה. גם במבחנים כמו Humanity's Last Exam ו-FrontierMath – הסוכן הציג שיפור משמעותי בביצועיו.

מאידך, יש לציין כי מומחה ד"ר מוסטק בילאל, מאוניברסיטת בינגהמטון, פוסט-דוקטורנט ב-Silvi.ai, המתמחה בכתיבה אקדמית משולבת AI ופועל כיועץ לחוקרים לשיפור התהליך האקדמי באמצעים טכנולוגיים, בדק את ביצועי הסוכן של OpenAI וביקש ממנו מצגת מסוימת. הוא צייץ וציין כי ההליך עד קבלת הפלט ארך זמן רב, יחסית. לדבריו ב-X: "נתתי ל-ChatGPT Agent קישור למאמר וביקשתי ממנו להציג מצגת המבוססת על המאמר. הוא עשה זאת באופן עצמאי, אבל זה לקח לו שעה שלמה". הוא הוסיף: "אז ל-Agent לוקח זמן רב, יש סיכוי להזיות, וזה עולה 20 דולר בחודש. לא בטוח שאנשי אקדמיה ימצאו את זה שימושי".

סוכן ה-ChatGPT החל להיפרס למשתמשי Pro, Plus ו-Team, ויהיה זמין בקרוב גם למשתמשי Enterprise ו-Education. כדאי לקחת בחשבון כי בעת שימוש חלות מגבלות על הפעילות בהתאם לסוג התוכנית שאליה אתם מנויים, כאשר משתמשי Pro מקבלים 400 פעולות בחודש, ומשתמשים אחרים בתשלום מקבלים 40 פעולות בחודש, עם אפשרות להגדלה באמצעות אשראי גמיש. חשוב לציין כי נכון לעכשיו, סוכן ה-ChatGPT אינו זמין בשוויץ או באזור הכלכלי האירופי (EEA) עקב מגבלות רגולטוריות וכן הוא לא זמין בינתיים למשתמשי התוכנית החינמית של החברה.

תגובות

(2)

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אין לשלוח תגובות הכוללות דברי הסתה, דיבה, וסגנון החורג מהטעם הטוב

אירועים קרובים