מבחן הכסף: האם AI סוכנית יכולה להצליח עבורכם בבורסה?

מודלי שפה מתחרים על ניהול תקציב השקעות קבוע ● אבל יש, מסתבר, ההבדל בין שעשועי רשת שבהם הבוטים מתחרים, לבין מדדי מדע מדויקים המראים את ערכה האמיתי של טכנולוגיית ה-AI במסחר - מהו?

מתחרים ביניהם על השקעה מוצלחת בבורסה. מודלי AI.צילום: אילוסטרציה. ג'מיני

עולם הבינה המלאכותית מצא לעצמו זירת ניסויים חדשה ומרתקת: שוק ההשקעות. אנחנו כבר לא מדברים רק על צ'אטבוטים שכותבים טקסטים, אלא על "סוכנים אוטונומיים" שמקבלים תקציב, סורקים נתונים, ומקבלים החלטות מסחר עצמאיות.

לאחרונה, מפתח ברשת (המוכר בכינוי Blotter-fyi) השיק תחרות מקוונת, שבה מודלי AI מקבלים גישה לכלים טכנולוגיים ונדרשים לנהל כסף וירטואלי בבורסה.

סוכני הבינה המלאכותית הוכיחו כי הם מסוגלים לצמצם באופן עקבי את ההפסד המקסימלי בתיק (Drawdown), וניהלו את תקציב ה-100 אלף דולר שלהם בזהירות רבה יותר ויעילה יותר מאסטרטגיית הבסיס במהלך ירידות שוק

דיווחים ראשוניים מיוצר התחרות הראו שמודלים כמו קלוד (Claude) של אנת'רופיק מובילים את הטבלה. אולם, בדיקה טכנולוגית מדוקדקת חושפת בעיה קריטית בתחרויות חובבניות אלו – התבססות על נתונים פגומים.

כך לדוגמה באחת הפעולות בתחרות, מודל קלוד רכש מניה של חברת אינטראקטיב ברוקרס (Interactive Brokers) בהתבסס על נתון שגוי לחלוטין שהוזן לו (מכפיל רווח של 11, בעוד שבמציאות הנתון עמד באותו זמן על 31). בעולם הטכנולוגיה זה נקרא "זבל נכנס, זבל יוצא", וכאשר המערכת מקבלת נתונים שגויים, גם אלגוריתם ה-AI המתקדם ביותר אינו יכול להציג יכולת אנליטית אמיתית.

מבחני המעבדה: המציאות האמיתית של ה-AI בבורסה

אבל יש לדעת כי כדי להבין באמת את היכולות הטכנולוגיות של המודלים בשוק המניות, האקדמיה משתמשת במדדים קפדניים ונקיים מזיהום נתונים היסטוריים. מדד בולט כזה הוא StockBench, שבוחן עשרות סוכני בינה מלאכותית בסביבת מסחר מציאותית ורציפה לאורך מספר חודשים. בניסוי מבוקר זה, כל מודל שפה מתחיל את דרכו עם סכום התחלתי קבוע של 100,000 דולר במזומן. המודלים מקבלים מדי יום נתוני אמת מאומתים הכוללים מחירי מניות, נתוני בסיס פיננסיים, ועד חמש כתבות חדשותיות עדכניות, ונדרשים לקבל החלטות מנומקות האם לקנות, למכור או להחזיק מניות.

תחרות השקעות של מודלי ה-AI באתר Arena*. צילום: לכידת מסך מ-https://rallies.ai/arena

טכנולוגיה של ניהול סיכונים מול אתגר התשואה

התוצאות של מדדי המסחר הרשמיים שופכות אור ממוקד על היכולת של בינה מלאכותית טכנולוגית להתמודד עם שוק המניות. מצד אחד, הטכנולוגיה מפגינה יכולת עיבוד ומהירות חסרות תקדים. במבחני מחקר פיננסי מעמיק, המודלים המתקדמים ביותר משלימים משימות חקר מורכבות על דוחות רשמיים בתוך כ-3 דקות בלבד, משימה שלוקחת לאנליסט אנושי קרוב ל-17 דקות. אך מן הצד השני, כשזה מגיע למבחן התוצאה האוטונומי בבורסה, המציאות מאתגרת הרבה יותר.

מתוצאות מדד ה-StockBench התברר כי למרות היכולת לקרוא ולנתח מידע במהירות, רוב סוכני ה-AI התקשו "להכות" אסטרטגיה פסיבית ופשוטה של "קנה והחזק" (Buy-and-hold) במונחי תשואה כספית כוללת. נתון טכנולוגי מפתיע נוסף שעלה מהמחקר הוא שמודלים שתוכננו וקונפגו במיוחד ל"חשיבה עמוקה" (Reasoning models) לא הציגו ביצועי מסחר טובים או עקביים יותר ממודלים רגילים מבוססי פקודות (Instruct), מה שמוכיח שיכולת הסקה כללית לא תמיד מתרגמת להחלטות מסחר מוצלחות בסביבה רועשת.

עם זאת, כאן נחשף יתרון טכנולוגי משמעותי אחר של ה-AI והוא תחום ניהול הסיכונים. סוכני הבינה המלאכותית הוכיחו כי הם מסוגלים לצמצם באופן עקבי את ההפסד המקסימלי בתיק (Drawdown), וניהלו את תקציב ה-100 אלף דולר שלהם בזהירות רבה יותר ויעילה יותר מאסטרטגיית הבסיס במהלך ירידות שוק.

המסקנה העולה ממבחני הביצועים היא שהמודלים של היום הם כלי עזר טכנולוגיים פנומנליים ומהירים לעיבוד הררי נתונים וצמצום סיכוני מסחר, אך ללא פיקוח אנושי צמוד ונתונים נטולי כל דופי, הם עדיין לא "מכונות הכסף" האוטונומיות כפי שהרשת מנסה לצייר אותם ולכן אולי מומלץ להמתין עם גיוס סוכני AI להשקעת כספכם אוטונומית פן ההרפתקה הזו תסתיים בעיקר עם חור בכיס וכאב בלב.

תוכלו להתרשם מאתר התחרות של המודלים ברשת, אבל נחזור ונזכיר כי לפי מומחים ולכאורה – תחרות זו סובלת מנתוני שוק שגויים.

תגובות

(0)

קלאודזון תפיץ את מודלי קלוד של אנתרופיק בישראל

אלתימיס מינתה שני בכירי צה"ל לשעבר להנהלתה

טכנולוגיית ה-VR שנולדה בעקבות ה-7 באוקטובר ומסייעת בריפוי הנפש

VMware וענקיות הענן נלחמות על השוק באירופה

המושבעים החליטו: אילון מאסק אשם בהטעיית משקיעי טוויטר

גיוס של 120 מ ד לאואזיס – ניהול גישה עבור סוכני AI וזהויות לא אנושיות

ה-FBI הפיל אתרים של קבוצת חנדלה הפרו-איראנית

מחקר: מתקפות הסייבר עוברות לייצור המוני

מבחן הכסף: האם AI סוכנית יכולה להצליח עבורכם בבורסה?

עידן "ההתכנסות הגמישה": המעבר מתשתיות נוקשות למודולריות מאוחדת

נשים ומחשבים: אורלי שטרית, אוקטופוסט

סכנה: מערך הדיגיטל הלאומי עלול לאבד את עצמאותו

כשה-Agent לוחץ על "שלח" לבד

נשים ומחשבים: עמית אזולאי-אברהם, פריוריטי

סוכן AI הוא לא עובד: יש להתייחס אליו כאל ספק חיצוני

ה-AI לא מחליפה מומחים – היא חושפת את הבינוניות

מבחן הכסף: האם AI סוכנית יכולה להצליח עבורכם בבורסה?

מבחני המעבדה: המציאות האמיתית של ה-AI בבורסה

טכנולוגיה של ניהול סיכונים מול אתגר התשואה

תגובות

כתיבת תגובה לבטל

אירועים קרובים

ידיעות מובילות

טקס מצטייני המחשוב: מהם הפרויקטים הזוכים?

טקס מצטייני המחשוב: מיהם.ן מנמ"רי.ות השנה?

וואן טכנולוגיות תפיץ ותשווק את פתרונות מייק בישראל

מפגן כוח ב-IT Awards: זכיות רבות במיוחד ל-מטריקס

טהרן חוותה "הפסקת חשמל" דיגיטלית

"סיכון קוד חייב להיות מנוהל בליבת הארגון, לא בשוליים"

קלאודזון תפיץ את מודלי קלוד של אנתרופיק בישראל

אלתימיס מינתה שני בכירי צה"ל לשעבר להנהלתה

טכנולוגיית ה-VR שנולדה בעקבות ה-7 באוקטובר ומסייעת בריפוי הנפש

VMware וענקיות הענן נלחמות על השוק באירופה

המושבעים החליטו: אילון מאסק אשם בהטעיית משקיעי טוויטר

גיוס של 120 מ ד לאואזיס – ניהול גישה עבור סוכני AI וזהויות לא אנושיות

ה-FBI הפיל אתרים של קבוצת חנדלה הפרו-איראנית

מחקר: מתקפות הסייבר עוברות לייצור המוני

מבחן הכסף: האם AI סוכנית יכולה להצליח עבורכם בבורסה?

עידן "ההתכנסות הגמישה": המעבר מתשתיות נוקשות למודולריות מאוחדת

נשים ומחשבים: אורלי שטרית, אוקטופוסט

סכנה: מערך הדיגיטל הלאומי עלול לאבד את עצמאותו

כשה-Agent לוחץ על "שלח" לבד

נשים ומחשבים: עמית אזולאי-אברהם, פריוריטי

סוכן AI הוא לא עובד: יש להתייחס אליו כאל ספק חיצוני

ה-AI לא מחליפה מומחים – היא חושפת את הבינוניות

מבחן הכסף: האם AI סוכנית יכולה להצליח עבורכם בבורסה?

מבחני המעבדה: המציאות האמיתית של ה-AI בבורסה

טכנולוגיה של ניהול סיכונים מול אתגר התשואה

תגובות

כתיבת תגובה לבטל

אירועים קרובים

תוכן פרסומי

תוכן פרסומי

תוכן פרסומי

ידיעות מובילות

טקס מצטייני המחשוב: מהם הפרויקטים הזוכים?

טקס מצטייני המחשוב: מיהם.ן מנמ"רי.ות השנה?

וואן טכנולוגיות תפיץ ותשווק את פתרונות מייק בישראל

מפגן כוח ב-IT Awards: זכיות רבות במיוחד ל-מטריקס

טהרן חוותה "הפסקת חשמל" דיגיטלית

"סיכון קוד חייב להיות מנוהל בליבת הארגון, לא בשוליים"