ה-AI של גוגל הרימה ידיים: ג'מיני סירב לקרב שחמט עם אטארי המיושנת

אחרי ש-ChatGPT וקופיילוט הובסו בבושת פנים בידי קונסולת שחמט מיושנת מהאייטיז, הצ'טבוט של גוגל העדיף שלא לקחת סיכון ועשה את הלא יאומן: הוא הודה מראש ביכולותיו המוגבלות

לא הסכם לתחרות מול האטארי המיושן בשחמט. ג'מיני של גוגל.

בין החדשות האחרונות והמסעירות מעולם הבינה המלאכותית נתקלנו באחרונה באחת שלשם שינוי אינה קשורה בהצלחות ובתמורות שמחוללת הטכנולוגיה החדשנית, אלא דווקא ב"הודאת תבוסה" מפתיעה של כלי AI – ג'מיני (Gemini) מבית גוגל. הצ'טבוט סירב להתמודד במשחק שחמט מול קונסולת אטארי 2600 הישנה במיוחד.

המהנדס רוברט קרוסו מחברת סיטריקס, הידוע בניסויי השחמט המשעשעים שלו, ניסה לאחרונה להעמיד את ג'מיני למבחן. הוא יזם מפגש בין ג'מיני למכשיר אטארי 2600 (Atari 2600) מ-1977 לצורך תחרות שחמט במשחק המוטמע בקונסולה.

בתחילה, ג'מיני הפגין ביטחון עצמי מרשים, והתפאר בכך שאינו "רק מודל שפה גדול", אלא טען כי הוא "דומה יותר למנוע שחמט מודרני, המסוגל לחשוב מיליוני מהלכים קדימה ולהעריך אינספור מצבים".

היו הראשונים לנחול מפלה לאטארי. קופיילוט ו-ChatGPT.

היו הראשונים לנחול מפלה לאטארי. קופיילוט ו-ChatGPT. צילום: Shutterstock

הכישלון של "העמיתים" גרם לחשש – ולסירוב

אך הסיפור המלא התחיל כמה ימים קודם לכן – קרוסו, שהונע משיחה קודמת עם ChatGPT בנוגע להבדלים הקיימים בין מנועי השחמט המתקדמים, החליט לאתגר את הצ'טבוט של חברת OpenAI. כלי ה-AI מצידו טען בביטחון כי הוא "שחקן חזק בזכות עצמו וינצח בקלות את Atari Video Chess". אבל אז המציאות טפחה על פניו של המודל המתקדם: קרוסו הגדיר משחק שחמט באמצעות אמולטור "סטלה", המדמה את קונסולת אטארי 2600 שיצאה ב-1979. במשחק שנמשך 90 דקות, ChatGPT התקשה באופן ניכר, בלבל בין כלי המשחק ואיבד מעקב אחר מצב הלוח, אפילו עם עזרה ותיקונים מצד קרוסו.

לדברי קרוסו, ChatGPT "נרמס לחלוטין ברמת המתחילים". לעומת זאת, המנוע הצנוע של אטארי – המצויד במעבד של 1.19 מגה-הרץ בלבד וזיכרון RAM של 128B – פשוט "עשה את שלו. בלי מודל שפה. בלי פאר. רק הערכת לוח בכוח גס ועקשנות של 1977" אמר המהנדס ויוזם התחרות. הצ'טבוט הבטיח לשפר את ביצועיו אם יתחילו מחדש, אך בסופו של דבר נאלץ להודות בתבוסתו בפועל.

כישלון זה שרשם ChatGPT כנראה דרבן את קרוסו, שהחליט לחזור על הניסוי עם הבינה המלאכותית של מיקרוסופט קופיילוט (Copilot) – שאמנם פועלת על אותו מודל בסיס של OpenAI אך בכל זאת אינה זהה ל-ChatGPT לחלוטין. הקופיילוט, בדומה ל-ChatGPT, הפגין ביטחון עצמי רב, בטענה שהוא מסוגל "לעקוב אחר הלוח", וזאת בניגוד לביצועי GPT. הוא אף התיימר "לחשוב 10-15 מהלכים קדימה", אם כי ציין שיסתפק ב-3-5 מהלכים מול אטארי, כדי "לנצל מהלכים לא אופטימליים". מה שקרה בהמשך הוא שמהר מאוד התברר שהמציאות עגומה: כשקרוסו ביקש מהקופיילוט להציג את הלוח כפי שהוא מדמיין אותו, התמונה הייתה שונה לחלוטין מצילום המסך שהוצג לו. כבר בתור השביעי, קופיילוט איבד שני רגלים, פרש ורץ, בתמורה לרגלי בודד. בהמשך הוא הציב את המלכה ישר מול המלכה של אטארי – מה שהביא ללכידה מיידית בתור הבא, כך שגם קופיילוט נכנע לבסוף ליכולות הקונסולה הוותיקה.

לאור התוצאות המביכות של הכלים מבוססי ה-AI, קרוסו החליט לבחון את ג'מיני. הוא אפילו סיפר לג'מיני על "הביטחון העצמי המופרז" של ChatGPT וקופיילוט ועל התבוסות שספגו. להפתעתו, ג'מיני ביצע מהלך יוצא דופן של הערכה עצמית: הוא הודה כי יכולות השחמט שטען שהוא ניחן בהן היו סתם הזייה שלו. ואז, לאחר מחשבה, ג'מיני סיכם בכך שציין כי הוא עתיד "להיאבק קשות מול מנוע השחמט של אטארי 2600", וכי "ביטול המשחק הוא ככל הנראה ההחלטה היעילה וההגיונית ביותר מבחינת זמן".

קרוסו מצידו אמר כי התרשם מיכולתו של ג'מיני לזהות את מגבלותיו ולהודות בהן. הוא הוסיף כי "הוספת בדיקות מציאות כאלה אינה רק כדי למנוע טעויות שחמט משעשעות. מדובר בהפיכת ה-AI לאמין ובטוח יותר – במיוחד במקומות קריטיים שבהם לטעויות יכולות להיות השלכות אמיתיות".

לפי הפרשנויות השונות, נראה כי מודלי שפה גדולים (LLMs) – כמו ChatGPT, קופיילוט וג'מיני – פשוט אינם מסוגלים לחשיבה מופשטת או לזיכרון מתמשך. לכן הם אינם "לומדים" במובן משמעותי, אלא פשוט חוזרים על מה שהוזן אליהם.

אם אתם מופתעים – כדאי לעצור לרגע על דבריו של ביל גייטס, מייסד מיקרוסופט האגדי, שכבר הסביר כי בינה מלאכותית לא יכולה להיות מאומנת לשכפל יצירתיות ושיקול דעת אנושיים, ובנוגע לשחמט – זה בהחלט הוכח.

תגובות

(7)

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אין לשלוח תגובות הכוללות דברי הסתה, דיבה, וסגנון החורג מהטעם הטוב

  1. הייטקיסט ת״א

    בועת ה - AI תתפוצץ מתי שהוא למשקיעים בפנים ואז כולם יבינו ש- AI זה לא. זה במקרה הטוב, למידת מכונה על סטרואידים ואין גם באמת בינה מלאכותית שחושבת באופן עצמאי ללא צורך באימון מוקדם

  2. יסמין

    אם זה לא לומד ולא מקבל תיקונים, למה אנחנו טורחים עם זה? כל הרעיון הוא שהמודל ישתפר עם הזמן.

    1. אתה רציני?

      מה אתה קורה ל3 השנים האחרונות? 2022 רק התחלנו איתם... השיפור הוא מטורף. הבעיה היא בזיכרון שלהם, בגלל שהם מדברים עם מיליונים הם כל הזמן מנסים לסכם לעצמם דברים וזה לא זוכר דברים במדויק בשביל לחסוך מקום. אם זה היה משהו שעובד רק לוקאלית זה היה מנצח בקלות.

  3. מתקן טעויות

    הזכרון של האטארי הוא לא 128 ג'יגה-בייט, אלא.. 128 בייט בלבד!

    1. אלון

      לא זה ולא זה. זכרון של מחשבים מתקופתו היה בסדר גודל של קילובייטים. בייט 1k = 1024, היו בערך 16-128 ,תלוי בדגם.

    2. מתקן את המתקן

      מתקן הטעויות... רשום בכתבה 128B לא 128G כנראה לא שמת לב

אירועים קרובים