כשהאלגוריתם מתחיל לשפוט את עצמו

המהפכה השקטה של LLM as a Judge עשויה לשנות לא רק את עולם הבינה המלאכותית, אלא גם את האופן שבו מתקבלות החלטות אשראי, נמדדת אמינות ונבנית אחריות בעידן פיננסי חדש

אמיר עוז, יועץ טכנולוגי לארגונים ובעברו מנמ"ר, ו-טל מצרי, סמנכ"ל טכנולוגיות ומנמ"ר בחברת לואן ווייז.צילום: ליאור כהן

בשנים האחרונות רובנו התרגלנו לחשוב על בינה מלאכותית בעיקר כעל כלי שמניב תוצרים – טקסטים, תחזיות, המלצות. אבל לאחרונה מתחיל להתפתח תפקיד נוסף למודלים הגדולים של השפה שאפשר בקלות לפספס אותו, כזה שמאתגר תפישות יסוד בעולם הפיננסי והטכנולוגי כאחד. לא עוד רק יצירה, אלא גם שיפוט. הרעיון של LLM as a Judge מציע להשתמש במודל אחד כדי להעריך את התוצרים של מודל אחר, ובכך להוסיף שכבת בקרה אוטומטית. עבור תחום הבנקאות והאשראי החוץ בנקאי, זה שינוי עמוק. אולי אפילו ברמה של המעבר לדיגיטציה.

גופים פיננסיים גדולים כמו ג'יי.פי. מורגן צ'ייס ו-גולדמן סאקס כבר בוחנים מודלים של בקרה מבוססת בינה מלאכותית, אך גם הם מבינים כי לא ניתן לוותר על שיקול דעת אנושי. השילוב הנכון אינו החלפה אלא השלמה

בין חיתום אוטומטי לשיפוט אלגוריתמי

מערכות חיתום אשראי הפכו בשנים האחרונות למורכבות ומבוססות נתונים יותר מאי פעם. מודלים סטטיסטיים, למידת מכונה ושכבות של חוקים עסקיים מתכנסים יחד כדי לייצר החלטה אחת קריטית: האם לאשר הלוואה ובאילו תנאים. אבל ככל שהמערכות מסתבכות, נהיה גם הרבה יותר קשה להבין מה בדיוק קורה בהן. כאן נכנס לתמונה השופט האלגוריתמי.

במקום להסתמך רק על תוצאת המודל, ניתן להפעיל מודל נוסף, שתפקידו לבחון את ההחלטה עצמה. האם היא עקבית עם מדיניות האשראי, האם יש סתירות בין הנתונים לבין ההמלצה והאם ההסבר הנלווה להחלטה עומד בסטנדרטים מקצועיים ורגולטוריים. במקום החלטה אחת סופית, אנחנו מקבלים תהליך קצת יותר 'שיחתי' בין מערכות, שבו כל החלטה נבחנת בזמן אמת.

הסבר הוא לא רק עניין פורמלי

אחת הדרישות המרכזיות של רגולטורים בעולם הפיננסי היא שקיפות. לקוח שבקשתו להלוואה נדחתה, זכאי להבין מדוע. בפועל, הרבה מההסברים הם טכניים מדי, לא באמת ברורים, ולפעמים אפילו מבלבלים. כאן נכנסת שכבת השיפוט כגורם מתווך בין השפה האלגוריתמית לבין השפה האנושית. מודל שופט יכול להעריך האם ההסבר שניתן ללקוח אכן משקף את הסיבות האמיתיות להחלטה, האם הוא מנוסח באופן בהיר והאם הוא עומד בדרישות משפטיות. זה כבר לא רק כלי טכני,אלא משהו שיושב בדיוק בין פסיכולוגיה של קבלת החלטות לבין אחריות משפטית. הסבר טוב אינו רק נכון עובדתית, אלא גם נתפש כהוגן. בעולם של אשראי חוץ בנקאי, שבו אמון הלקוח נשחק לעיתים – זו יכולה להיות נקודת מפנה.

מציע להשתמש במודל אחד כדי להעריך את התוצרים של מודל אחר. LLM as a Judge. צילום: אילוסטרציה. ג'מיני

בין הונאה לאינטואיציה מלאכותית

זיהוי הונאות היה מאז ומתמיד שילוב של חוקים קשיחים ואינטואיציה אנושית. מנהל סיכונים מנוסה יודע לזהות דפוסים חריגים, גם כאשר הם אינם מתועדים במודל. LLM as a Judge מביא ניסיון לייצר אינטואיציה כזו באמצעים מלאכותיים.

כאשר מודל מזהה התנהגות חשודה, השופט האלגוריתמי יכול לבחון את ההקשר הרחב. האם מדובר בחריגה לגיטימית או בדפוס בעייתי. האם יש נרטיב קוהרנטי שמסביר את הנתונים. בכך נוצרת שכבה שמנסה לחקות לא רק ניתוח נתונים אלא גם פרשנות. עם זאת, יש לזכור כי מדובר בפרשנות הסתברותית, לא בהבנה אמיתית. והסיכון לטעות, במיוחד בגין ביטחון יתר – עדיין שם.

יועץ המשכנתאות, הלקוח והאלגוריתם שביניהם

במודלים עסקיים של B2B2C, כמו אלו הנהוגים באשראי חוץ בנקאי למשכנתאות, יועץ המשכנתאות הוא שחקן מרכזי. הוא מתווך בין המערכת לבין הלקוח ולעיתים גם משפיע על האופן שבו נתונים מוצגים.

כאן נכנס השופט ככלי בקרה על השיח עצמו. ניתן לנתח שיחות, טפסים והמלצות, ולבחון האם היועץ פעל בהתאם למדיניות, האם נמסר מידע מדויק והאם לא ניתנו הבטחות שאינן עומדות בקנה אחד עם המציאות. זה גם שינוי סוציולוגי לא קטן, שבו הבקרה אינה מופעלת רק על החלטות אלא גם על אינטראקציות. במובן זה, האלגוריתם אינו רק כלי ניהולי אלא גם גורם שמעצב נורמות התנהגות.

אחריות בעידן של שיפוט אוטומטי

ברגע שמכניסים שופט אלגוריתמי למערכת פיננסית, מיד עולות שאלות לא פשוטות של אחריות. מי אחראי כאשר השופט טועה? האם ניתן להסתמך על שיפוט אוטומטי בהחלטות שמשפיעות על חיי אדם? ומה המשמעות של מערכת שבה אלגוריתם אחד בוחן אלגוריתם אחר.

גופים פיננסיים גדולים כמו ג'יי.פי. מורגן צ'ייס (JPMorgan Chase) ו-גולדמן סאקס (Goldman Sachs) כבר בוחנים מודלים של בקרה מבוססת בינה מלאכותית, אך גם הם מבינים כי לא ניתן לוותר על שיקול דעת אנושי. השילוב הנכון אינו החלפה אלא השלמה. השופט האלגוריתמי אינו תחליף לרגולציה, אלא כלי שמאפשר ליישם אותה בצורה עקבית יותר.

בסופו של דבר, LLM as a Judge הוא לא רק פתרון טכנולוגי. הוא ביטוי למעבר עמוק יותר בתפישה של מערכות מורכבות. ממערכות שמייצרות תשובות, למערכות שמבקרות את עצמן. בעולם שבו אמון הוא משאב די נדיר, במיוחד באשראי חוץ בנקאי, היכולת להראות לא רק מה הוחלט אלא גם כיצד נבחנה ההחלטה עשויה להפוך ליתרון תחרותי של ממש.

כותבי המאמר הם אמיר עוז, יועץ טכנולוגי לארגונים ובעברו מנמ"ר, וטל מצרי, סמנכ"ל טכנולוגיות ומנמ"ר בחברת לואן ווייז

תגובות

(0)

קריסת צמרת xAI של מאסק: המייסדים נטשו לקראת ה-IPO ההיסטורי

"חשיבה לטווח קצר של הבורסה גרמה לארה"ב לאבד את יתרונה בתעשיית השבבים"

"סיפור ה-AI הוא בראש ובראשונה סיפור אנושי"

סאפ רוכשת חברת ניהול נתונים בשני מיליארד דולר

איראן פרצה לחשבונו האישי של ראש ה-FBI

"האתגר: יתירות למלאי ול-IT, בארץ וגם בחו"ל"

"איראן העבירה הילוך בסייבר: מריגול ומודיעין – להשמדת נתונים והרס"

טראמפ מינה את אליסון, צוקרברג והואנג ליועצי AI

כשהאלגוריתם מתחיל לשפוט את עצמו

ה-IT במלחמה: עברנו את פרעה – אנחנו עוברים גם את זה

סופה של סורה: למה OpenAI הרגה את ה"צעצוע" הכי מרגש שלה?

שוק העבודה בזמן אי־ודאות: למה עומק מקצועי חשוב יותר מתמיד?

נשים ומחשבים: נירית חן, קבוצת iTalent

האם דור ה-Z באמת מאבד את המוח או דווקא בונה אותו מחדש?

המתח בין החדש לישן: כיצד לחבר בין אסטרטגיית ה-AI והמיינפריים?

זה היה הרבעון שהיה לענף ה-IT בישראל

כשהאלגוריתם מתחיל לשפוט את עצמו