זוז הצידה, דיפסיק: מאנוס הוא טירוף ה-AI הסיני החדש
הסינים שוב הקדימו את המערב, ומציעים מודל בינה מלאכותית מתקדם יותר, ועם הרבה יותר יכולות ● ניב ליליאן התנסה ומביא את רשמיו
הגביע הקדוש של תעשיית הבינה המלאכותית (אני חושב שכבר אפשר לקרוא לה תעשיה) הוא מה שנקרא בינה מלאכותית כללית, או AGI. בניגוד לכלים המוכרים לנו כיום, שהם "בינה מלאכותית צרה", שמיועדת למשימות ספציפיות (אף על פי שיש מי שיטען שגם ה-"צרות" הולכות ומתרחבות…), בינה מלאכותית כללית נועדה לחשוב כמו בן אדם. היא נועדה לפרק מטלה מורכבת למשימות קטנות, ולבצע כל אחת מהן תוך שהיא משתמשת בכלים ומפעילה בעצמה בינות מלאכותיות צרות לביצוען. שלב הביניים הוא מה שמכונה גם סוכנים חכמים, או AI Agents. כלי חדש בשם מאנוס (Manus – יד בלטינית) עושה צעד גדול בכיוון, כששוב, הסינים מקדימים את המערב.
כבר כתבתי כאן על סוכנים חכמים, אבל מאנוס נראה כמו הדבר הבא, בגלל הצורה שבה הוא עובד – הוא מתנהל כמו בן אדם בביצוע המשימות שלו, ובעל יכולות רחבות יותר ממודלים אחרים.
בסרטון ההדגמה של מאנוס, שנראה כאן, ייצ'או "פיק" ג'י, המייסד והמדען הראשי של החברה, מציג כיצד הכלי מבצע פעולה המאוסה על כל מגייס או מגייסת כוח אדם באשר הם: מיון קורות חיים. מאנוס ממש פותח את הקבצים וקורא אותם, ואז "שולף" מתוך הערימה את המועמדים שהכי מתאים לראיין. באופן דומה, אם נותנים לו לחפש מידע באינטרנט, הוא פותח דפדפן וקורא דפים ואתרים שלמים – ואפילו גולל, בדיוק כמו בן אדם. למאנוס יש גם זיכרון לאופן שבו אתם מעדיפים לקבל את התוצרים שלכם: כך, אם ביקשתם שהוא ייתן לכם את הפלט בצורה של גיליון אלקטרוני – הוא יזכור את התוצר המועדף עליכם בפעם הבאה שיבצע משימה דומה. בנוסף, אפשר ללמד אותו ידנית ולהוסיף לו הוראות איך לבצע דברים.
אם זה מזכיר לכם עובד שקדן – התחושה איננה מקרית, והחוזקה של מאנוס לעומת כלים מוכרים אחרים היא רמת האוטונומיה הגבוהה שאליה הוא הגיע.
משימה שבינות מלאכותיות אחרות התקשו לבצע
בזכות אותה רמת אוטונומיה והבנה, העבודה מול מאנוס תחושתית, ממש כאילו עובדים מול אדם קשוב. אני, למשל, נתתי למאנוס משימה שבינות מלאכותיות אחרות התקשו בה או לא יכלו לבצע אותה – בניית ערכת עיצוב חדשה לאתר וורדפרס, ומאנוס לא נבהל. הוא בדק אתרים שאמרתי לו שהסגנון שלהם מוצא חן בעיניי כמקור לעיצוב, חפר ובדק את האתר שאותו רציתי לעצב מחדש – ואז ישב וכתב את ערכת העיצוב החדשה, מאפס, הציג לי סקיצה של העיצוב החדש לאישור וקיבל ממני תיקונים. כל התהליך לקח 20 דקות בערך. כל מי שעבד אי פעם על עיצוב דומה מול מעצב אנושי יודע שהליך ה-"פינג פונג" של משוב ותיקונים מול מעצב בשר ודם הרבה יותר ארוך מזה.
ולא רק אני: סוקר מ-MIT Technology Review נתן למאנוס מטלה של חיפוש דירות, וגם הוא ציין שהתחושה בעבודה עם הכלי הזה היא כמו לעבוד עם מתמחה נלהב. מאנוס לא התעצל, פתח דפדפן, חיפש מידע במקורות אמינים ורלוונטיים, ואז הגיש לסוקר כמה דירות מומלצות עם כותרות כמו "התמורה הכי טובה לכסף" או "האופציה היוקרתית". התחושה שלו הייתה של כתבת המלצות שכתב מישהו עם רקע בנדל"ן.
חלק מהיופי הוא שמאנוס יודע לשאול שאלות הבהרה לפני ביצוע המשימה, אם יש משהו שהוא לא מבין, ממש כמו עובד שלא רוצה להיכשל במשימה שהבוס הטיל עליו. בגלריית הדוגמאות של מאנוס אפשר למצוא עוד מטלות שהוא יודע לבצע, כמו לתאם ראיונות ל-40 מועמדים, לכתוב משחקי מחשב, לשפר אסטרטגיית מכירות, לערוך פודקאסט ולעצב כרטיס ביקור. היכולות שלו בהחלט נראות יותר רחבות מכל מה שהתרגלנו לקבל ממודלים עד כה.
הייחודיות הטכנית של מאנוס
מאנוס ייחודי לא רק בכמות ובאיכות המשימות שהוא מסוגל לבצע, אלא יש לו גם ייחודיות טכנית: הוא לא פועל על LLM אחד, אלא על כמה מהם, משולבים. הוא פועל במקביל, בין היתר, על מודלים כמו Claude 3.5 של אנת'רופיק וגרסה מותאמת של Qwen, מודל הבינה המלאכותית הפתוח של עליבאבא. התוצאה הסופית, כאמור, מרשימה.
עד לאחרונה, מאנוס היה בבטה סגורה וחשאית משהו, והיה צורך בהזמנה ממשתמש קיים כדי לקבל את האפשרות להשתמש בו, כמו שהיה בהתחלה עם ג'ימייל. אתמול (ב') פתחה החברה את המודל שלה לציבור. מאנוס מציעה גרסה חינמית של המודל, עם 1,000 קרדיטים, שנגמרים מהר מאוד, ושני מנויים חודשיים: Starter, שמציע, בעלות של 39 דולר, 3,900 קרדיטים ואפשרות להרצת שתי משימות במקביל, וכן מנוי Pro בעלות של 199 דולר, שמספק 19 אלף קרדיטים ואפשרות להריץ חמש משימות במקביל. זה לא זול, אבל עדיין פחות יקר מחבויות מעביד אם מעסיקים מתמחה.











עדיין לא פתוח לציבור ואני שמתי את המייל בדף הרשמה. רוצה לחפש כרטיסי טיסה.