מדוע סוכני AI שעובדים יחד עדיפים על סוכן בודד?
סוכנים בודדים נתקלים בתקרה כאשר שיחות מתארכות מעבר למה שמכונה חלון הקונטקסט שלהן, לעומת מערכות מרובות סוכנים, שבהן מחלקים את העבודה בין כמה סוכנים מתמחים שמתואמים ביניהם
דמיינו את התרחיש הבא: סוכן AI אחד מתחיל שיחת שירות לקוחות ומנסה לעקוב אחר בעיית חיוב. אחרי כחמישה עשר חילופי דברים הוא מאבד את חוט המחשבה, שוכח מה הייתה הבעיה המקורית ומתחיל להציע פתרונות לנושא אחר לגמרי. בתרחיש אחר, אותו סוכן מנתח דו"ח אבטחת מידע בן 50 עמודים. הוא מאתר שלוש חולשות קריטיות בפרק הראשון, אך עד עמוד 30 הממצאים כבר נשמטים והוא ממשיך כאילו לא נמצאו.
"כאשר עוברים מארכיטקטורה של סוכן יחיד למערכות מרובות סוכנים נפתחות יכולות חדשות. אחת המרכזיות היא פירוק משימות לעבודה מקבילית. סוכנים שונים יכולים לטפל בתת-משימות שונות בו זמנית"
זו אינה תקלה שנפתרת בעזרת ניסוח פרומפט טוב יותר. סוכנים בודדים נתקלים בתקרה כאשר שיחות מתארכות מעבר למה שמכונה חלון הקונטקסט שלהן, כאשר המשימה דורשת מעבר בין סוגי מומחיות שונים, או כאשר המורכבות הכוללת של הבעיה חורגת מיכולת ההסקה של מודל יחיד. הנדסת פרומפטים יכולה לשפר ניסוח או דיוק נקודתי, אך אינה פותרת מגבלות מבניות. כאן נכנסות לתמונה מערכות מרובות סוכנים. במקום לבקש ממודל אחד לבצע הכל, מחלקים את העבודה בין כמה סוכנים מתמחים שמתואמים ביניהם.
האתגרים של סוכן יחיד
ביישומים ארגוניים חוזרות שוב ושוב שלוש מגבלות מרכזיות. הראשונה היא זיכרון. חלון ההקשר הופך לצוואר בקבוק. כאשר מזינים היסטוריית שיחה ארוכה, עולה הסיכון לסטייה מהנושא. הסוכן מתחיל לשכוח פרטים שהוזכרו בתחילת השיחה והעקביות נפגעת.
המגבלה השנייה היא אמינות מול מורכבות. סוכן יחיד מתקשה כאשר פתרון הבעיה דורש שימוש במספר מערכות וכלי עבודה במקביל וכן עמידה באילוצים שונים של תחומים מקצועיים שונים.
המגבלה השלישית היא עומס קוגניטיבי. כאשר עובדים עם קונטקסט ארוך או תהליכי עבודה מורכבים, יכולת ההסקה של המודל נשחקת. הסוכן מאבד את המעקב אחר ממצאים מוקדמים ואחר ההקשר הכולל של המשימה.
מערכות מרובות סוכנים
כאשר עוברים מארכיטקטורה של סוכן יחיד למערכות מרובות סוכנים נפתחות יכולות חדשות. אחת המרכזיות היא פירוק משימות לעבודה מקבילית. סוכנים שונים יכולים לטפל בתת-משימות שונות בו זמנית.
יכולת נוספת היא יצירת תהליכי עבודה שומרי state. במקום רצף ליניארי של שלבים ניתן לבנות תהליכים שבהם סוכנים חוזרים לנקודות קודמות, בודקים מחדש החלטות ומנתבים את התהליך בהתאם לתנאים משתנים.
היבט חשוב נוסף הוא שילוב בני אדם בתהליך. במערכות כאלה קל יותר לשלב מומחים אנושיים בנקודות החלטה קריטיות. לדוגמה, במערכות אבחון רפואי סוכני מחקר יכולים לאסוף מידע ולנתח נתונים, בעוד רופאים מאשרים את ההחלטות.
מערכות מרובות סוכנים גם מציעות עמידות גבוהה יותר לתקלות. כאשר מתכננים מנגנוני גיבוי ניתן להמשיך בפעולה גם אם סוכן אחד נכשל. בנוסף קיימת יכולת להתרחב בצורה הדרגתית. במקום להעמיס עוד יכולות על סוכן יחיד, ניתן להוסיף סוכנים מומחים נוספים לפי הצורך.
סוכנים בודדים יעילים כאשר המשימה פשוטה יחסית. הם יכולים לענות על שאלות נפוצות, ליצור סיכומים או לכתוב קוד בסיסי. אולם כאשר תהליך העבודה דורש תיאום בין תחומים שונים בעלי אילוצים שונים, הסוכן היחיד מתקשה.
שירות לקוחות הוא דוגמה טובה לכך, טיפול בפנייה עשוי לדרוש שליפת נתוני חשבון, אימות מדיניות, עדכון חיובים והחלטה על העברה לטיפול אנושי. כל פעולה כזו נשענת על מקורות מידע שונים וכללי רגולציה. גם בזיהוי הונאות יש צורך לשלב ניתוח עסקאות, דפוסי התנהגות ובדיקות רגולטוריות.
מערכות מרובות סוכנים פותרות את הבעיה באמצעות חלוקת אחריות בין סוכנים שונים. סוכן אחד מבצע שליפות נתונים, סוכן אחר מאמת מדיניות וסוכן שלישי מבצע פעולה או מנסח תשובה.
עם זאת, המעבר אינו חף מאתגרים. ויתור על סוכן יחיד משמעותו הצורך לתאם בין כמה סוכנים. הדבר דורש תשתית שמאפשרת סנכרון, העברת הודעות ונראות מלאה של התהליך. לפי מחקרים, יותר מ-40% מפרויקטי הבינה המלאכותית הסוכנית צפויים להתבטל עד סוף 2027 משום שארגונים העריכו בחסר את מורכבות הפריסה. בנוסף, כ-86% מהארגונים זקוקים לשדרוג תשתיות לפני שיוכלו לפרוס מערכות כאלה בסביבת ייצור.
דפוסי הארכיטקטורה המרכזיים
יש כמה תבניות מרכזיות לבניית מערכות מרובות סוכנים. הראשונה היא אורקסטרציה היררכית (Hierarchical Orchestration). במודל זה סוכן מתאם מחלק משימות ומנהל את סדר הפעולות. היתרון הוא בקרה טובה יותר על התהליך, אך המתאם עלול להפוך לצוואר בקבוק.
המודל השני הוא תיאום Peer to peer. כאן הסוכנים מתקשרים ישירות זה עם זה באמצעות העברת הודעות. הגישה גמישה יותר אך עלולה ליצור השהיה בכל נקודת מעבר.
המודל השלישי מבוסס על מאגר ידע משותף המכונה לעיתים מודל לוח מודעות. כל הסוכנים במערכת יכולים לקרוא ולכתוב למאגר זה ולתרום לפתרון הבעיה כאשר יש להם מידע רלוונטי.
מודל נוסף הוא מבנה זיכרון דו שכבתי (Dual tier). זיכרון לטווח קצר משמש להקשר המיידי של המשימה, בעוד זיכרון לטווח ארוך מאפשר אחזור מידע מהיסטוריית העבודה. כך ניתן להימנע מחזרה על פעולות שכבר בוצעו.
אף אחד מהדפוסים האלה אינו פתרון קסם. מערכות היררכיות יוצרות צווארי בקבוק בקורדינציה. תקשורת Peer-to-peer יכולה להוסיף השהיה בנקודות התיאום. ארכיטקטורות לוח מודעות דורשות ניהול state זהיר. הדפוס הנכון תלוי בתקורת התיאום הנדרשת, בסבילות לכשלים ובדרישות ה-scale.
מהירות ותיאום
כאשר כמה סוכנים עובדים יחד, עצם התיאום ביניהם עלול להפוך לעומס. אם זמן התיאום גבוה מדי, יתרון העבודה המקבילית נעלם. מערכת מרובות סוכנים חייבת להפחית את זמן העיבוד הכולל יותר מכפי שהשהיית התיאום מוסיפה לו. אחרת היא עלולה להיות איטית יותר מסוכן יחיד.
תשתית
מערכות מרובות סוכנים מספקות תוצאות מדידות כאשר הארכיטקטורה והתשתית מותאמות לבעיה.
כאשר בונים מערכת מרובת סוכנים שצריכה לצמוח מעבר לשלב הניסוי, התשתית הופכת לגורם מכריע. תיאום מהיר, ניהול זיכרון ואחזור ידע יעיל הם המפתח לכך שהמערכת תפעל בצורה יציבה גם בקנה מידה גדול.
הכותב הוא סמנכ"ל ארכיטקטורה ברדיס.











תגובות
(0)