מבחן הכסף: האם AI סוכנית יכולה להצליח עבורכם בבורסה?
מודלי שפה מתחרים על ניהול תקציב השקעות קבוע ● אבל יש, מסתבר, ההבדל בין שעשועי רשת שבהם הבוטים מתחרים, לבין מדדי מדע מדויקים המראים את ערכה האמיתי של טכנולוגיית ה-AI במסחר - מהו?
עולם הבינה המלאכותית מצא לעצמו זירת ניסויים חדשה ומרתקת: שוק ההשקעות. אנחנו כבר לא מדברים רק על צ'אטבוטים שכותבים טקסטים, אלא על "סוכנים אוטונומיים" שמקבלים תקציב, סורקים נתונים, ומקבלים החלטות מסחר עצמאיות.
לאחרונה, מפתח ברשת (המוכר בכינוי Blotter-fyi) השיק תחרות מקוונת, שבה מודלי AI מקבלים גישה לכלים טכנולוגיים ונדרשים לנהל כסף וירטואלי בבורסה.
סוכני הבינה המלאכותית הוכיחו כי הם מסוגלים לצמצם באופן עקבי את ההפסד המקסימלי בתיק (Drawdown), וניהלו את תקציב ה-100 אלף דולר שלהם בזהירות רבה יותר ויעילה יותר מאסטרטגיית הבסיס במהלך ירידות שוק
דיווחים ראשוניים מיוצר התחרות הראו שמודלים כמו קלוד (Claude) של אנת'רופיק מובילים את הטבלה. אולם, בדיקה טכנולוגית מדוקדקת חושפת בעיה קריטית בתחרויות חובבניות אלו – התבססות על נתונים פגומים.
כך לדוגמה באחת הפעולות בתחרות, מודל קלוד רכש מניה של חברת אינטראקטיב ברוקרס (Interactive Brokers) בהתבסס על נתון שגוי לחלוטין שהוזן לו (מכפיל רווח של 11, בעוד שבמציאות הנתון עמד באותו זמן על 31). בעולם הטכנולוגיה זה נקרא "זבל נכנס, זבל יוצא", וכאשר המערכת מקבלת נתונים שגויים, גם אלגוריתם ה-AI המתקדם ביותר אינו יכול להציג יכולת אנליטית אמיתית.
מבחני המעבדה: המציאות האמיתית של ה-AI בבורסה
אבל יש לדעת כי כדי להבין באמת את היכולות הטכנולוגיות של המודלים בשוק המניות, האקדמיה משתמשת במדדים קפדניים ונקיים מזיהום נתונים היסטוריים. מדד בולט כזה הוא StockBench, שבוחן עשרות סוכני בינה מלאכותית בסביבת מסחר מציאותית ורציפה לאורך מספר חודשים. בניסוי מבוקר זה, כל מודל שפה מתחיל את דרכו עם סכום התחלתי קבוע של 100,000 דולר במזומן. המודלים מקבלים מדי יום נתוני אמת מאומתים הכוללים מחירי מניות, נתוני בסיס פיננסיים, ועד חמש כתבות חדשותיות עדכניות, ונדרשים לקבל החלטות מנומקות האם לקנות, למכור או להחזיק מניות.

תחרות השקעות של מודלי ה-AI באתר Arena*. צילום: לכידת מסך מ-https://rallies.ai/arena
טכנולוגיה של ניהול סיכונים מול אתגר התשואה
התוצאות של מדדי המסחר הרשמיים שופכות אור ממוקד על היכולת של בינה מלאכותית טכנולוגית להתמודד עם שוק המניות. מצד אחד, הטכנולוגיה מפגינה יכולת עיבוד ומהירות חסרות תקדים. במבחני מחקר פיננסי מעמיק, המודלים המתקדמים ביותר משלימים משימות חקר מורכבות על דוחות רשמיים בתוך כ-3 דקות בלבד, משימה שלוקחת לאנליסט אנושי קרוב ל-17 דקות. אך מן הצד השני, כשזה מגיע למבחן התוצאה האוטונומי בבורסה, המציאות מאתגרת הרבה יותר.
מתוצאות מדד ה-StockBench התברר כי למרות היכולת לקרוא ולנתח מידע במהירות, רוב סוכני ה-AI התקשו "להכות" אסטרטגיה פסיבית ופשוטה של "קנה והחזק" (Buy-and-hold) במונחי תשואה כספית כוללת. נתון טכנולוגי מפתיע נוסף שעלה מהמחקר הוא שמודלים שתוכננו וקונפגו במיוחד ל"חשיבה עמוקה" (Reasoning models) לא הציגו ביצועי מסחר טובים או עקביים יותר ממודלים רגילים מבוססי פקודות (Instruct), מה שמוכיח שיכולת הסקה כללית לא תמיד מתרגמת להחלטות מסחר מוצלחות בסביבה רועשת.
עם זאת, כאן נחשף יתרון טכנולוגי משמעותי אחר של ה-AI והוא תחום ניהול הסיכונים. סוכני הבינה המלאכותית הוכיחו כי הם מסוגלים לצמצם באופן עקבי את ההפסד המקסימלי בתיק (Drawdown), וניהלו את תקציב ה-100 אלף דולר שלהם בזהירות רבה יותר ויעילה יותר מאסטרטגיית הבסיס במהלך ירידות שוק.
המסקנה העולה ממבחני הביצועים היא שהמודלים של היום הם כלי עזר טכנולוגיים פנומנליים ומהירים לעיבוד הררי נתונים וצמצום סיכוני מסחר, אך ללא פיקוח אנושי צמוד ונתונים נטולי כל דופי, הם עדיין לא "מכונות הכסף" האוטונומיות כפי שהרשת מנסה לצייר אותם ולכן אולי מומלץ להמתין עם גיוס סוכני AI להשקעת כספכם אוטונומית פן ההרפתקה הזו תסתיים בעיקר עם חור בכיס וכאב בלב.
תוכלו להתרשם מאתר התחרות של המודלים ברשת, אבל נחזור ונזכיר כי לפי מומחים ולכאורה – תחרות זו סובלת מנתוני שוק שגויים.












תגובות
(0)