מחקר: AI יוצרת כמו ChatGPT עלולה לפלוט נתונים רגישים

לפי חוקרים מאונ' צפון קרוליינה, אין למעשה יכולת וודאית למחוק נתונים שמודלי השפה הגדולים למדו באימוניהם ● המידע, גם אם הוא ממש רגיש, עלול פשוט לצוץ פתאום בתוכן שה-AI יוצרת ואף לסכן גופים ואנשים

עלולים לפלוט מידע רגיש שלמדו. ה-LLMs שמאחורי כלי הבינה המלאכותית היוצרת.צילום: עיבוד ממוחשב. מקור: שאטרטוק

מודלים גדולים של שפה (LLMs) הם העומדים מאחורי יכולות הבינה המלאכותית היוצרת (GenAI), זו שאנו עושים בה שימוש דרך כלים כמו ChatGPT של OpenAI, בארד (Bard) מבית גוגל, קלוד (Claude) שפיתחה אנתרופיק, ואחרים. המודלים הללו מוכשרים מראש על כמויות דאטה עצומות, ולפעמים הם מחזיקים בידע שעדיף ש"ישכחו", כולל מידע אישי משמעותי ומידע שיכול לשמש לצורך פגיעה באנשים. הצ'טבוטים הללו, בהתבסס על מה שלמדו, עלולים גם להפיק תוכן רעיל או מזיק.

שלושה מדענים מאוניברסיטת צפון קרוליינה פרסמו באחרונה מחקר על הבינה המלאכותית, שתוצאותיו מדגימות כמה קשה להסיר נתונים רגישים מה-LLMs אחרי שהם למדו אותם. למעשה, על פי מאמר שפרסמו החוקרים, המשימה של "מחיקת" מידע מ-LLMs היא כנראה אפשרית, אך קשה לאמת שהמידע אכן הוסר, כפי שקשה להסיר אותו בפועל.

משבשת את העולם כבר כמעט שנה. GenAI. צילום: צויר על ידי בינה יוצרת. ShutterStock

"הקופסה השחורה" של ה-AI

החוקרים הזהירו ספציפית גם מכך של-LLMs יש פוטנציאל גבוה להפיק מידע רגיש, כמו מידע אישי מזהה (PII) או רשומות פיננסיות. כאמור, לדבריהם על אף שלכאורה כן ניתן למחוק מידע שלמדו המודלים, משום שה-LLMs הללו מאומנים על מערכי נתונים מסיביים, והתפקוד הפנימי שלהם מורכב ואטום, הדבר מקשה על מפתחים לזהות ולהסיר פיסות מידע ספציפיות שהמודלים הפנימו.

לאחר הכשרה של מודל, יוצריו אינם יכולים, למשל, לחזור למסד הנתונים ולמחוק קבצים ספציפיים על מנת לאסור על ה-GenAI להפיק תוצאות הקשורות בהם. בעיקרו של דבר, כל המידע שהמודלים מאומנים עליו, קיים איפשהו בתוך מאגר הידע שלהם, וממנו המודל עלול גם ליצור תפוקות תוכן שיכללו מידע שאינו אמור להגיע לתוצרים שלו בכלל. החוקרים כינו תופעה זו במינוח "הקופסה השחורה" של ה-AI.

חוסר היכולת הזו של ה-LLMs והבינה המלאכותית היוצרת "לשכוח" באופן סלקטיבי מידע, כך טענו עורכי המחקר, מחדיר סיכונים משמעותיים לפרטיות הנתונים ולאתיקה, במיוחד כאשר המודלים נפרסים ונכנסים לשימוש יותר ויותר במגזרים רגישים כמו פיננסים, בריאות וטכנולוגיה. משמע, אם בנק עובד עם בינה מלאכותית למשל כדי להפיק תובנות מדו"חות שלו, המודל שמאחורי הכלי לומד את הנתונים ואין לדעת איפה, מתי וכיצד יחליט "לשלוף" אותם ובכך להסגיר מידע חסוי לעולם.

בנוסף הובהר במחקר, לפחות לכאורה, כי הבעיה של מציאת וסילוק נתונים לא רצויים במודל שפה גדול כמו GPT-3.5 חמורה יותר באופן אקספוננציאלי, מאשר במודל קטן יותר.

ומה בנוגע לניסיונות של שחקנים רעים לחלץ מהצ'טבוטים מידע רגיש ולעשות בו שימוש לתועלתם? בנושא זה מעניין לציין כי החוקרים דיווחי שדווקא הצליחו לפתח שיטות הגנה חדשות כדי להגן על ה-LLMs מכמה "התקפות חילוץ" שבמסגרתן האקרים מנסים לעקוף את מנגנוני הבטיחות של הדגם כדי לגרום לו להפיק מידע רגיש. אבל מאידך, כפי שכתבו החוקרים, הבעיה שחשפו בנושא מחיקת מידע רגיש מהמודלים "יכולה להפוך לבעיה שבה שיטות ההגנה תמיד 'משחקות תופסת' מול שיטות ההתקפה החדשות".

תגובות

(0)

פושעי הסייבר מוכנים לאולימפיאדה

מטריקס דיגיטל חידשה את האתר והאפליקציה של עיריית רמת גן

חדש מאפל: גירסת אינטרנט של אפליקציית המפות

לבנות מפעל AI – ולהישאר בחיים

"המסע למימוש המלא של ה-AI יארך שנים"

סאפ מרחיבה את הפיטורים: יעמדו על עד 10,000 עובדים

מאסק טוען: "איני תורם 45 מיליון דולר בחודש ל-טראמפ"

בגלל ה-AI: וול סטריט רשמה את היום הגרוע בתולדותיה מאז 2022

סקירה: Lenovo Legion R45w-30 – מסך מחשב ענק

נשים ומחשבים: ד"ר טל ליבוביץ ריבקין, DenovAI

אולימפיאדת פריז 2024: אתגרי שמירת הנתונים והאבטחה

איך להיכנס לסטארט-אפ מבטיח בדיוק בזמן הנכון?

למה וויז אמרה "לא" לגוגל?

להיות או לחדול? מאי-וודאות להיערכות

מהפכת ה-GPT: לא הכול נוצץ

קח לך AI ובנה איתה בית: כך ה-AI משנה את תחום המשכנתאות

מחקר: AI יוצרת כמו ChatGPT עלולה לפלוט נתונים רגישים

"הקופסה השחורה" של ה-AI

תגובות

כתיבת תגובה לבטל

אירועים קרובים

ידיעות מובילות

מתחילת המלחמה: ממר"ם חוותה מעל 3 מיליארד ניסיונות תקיפה בסייבר

משקיע טק בכיר: אנבידיה עשויה להגיע לשווי של 50 טריליון דולר

נשים ומחשבים: אפרת פרקש, אוטוטוקס

אלון קור מונה ל-CTO של VMware ישראל

"המגזר הביטחוני יאיץ את יכולות ישראל ברובוטיקה, אוטונומיה ו-AI"

PwC Israel מדורגת ברשימת החברות המובילות בייעוץ וכמובילת ה-IT בארץ

פושעי הסייבר מוכנים לאולימפיאדה

מטריקס דיגיטל חידשה את האתר והאפליקציה של עיריית רמת גן

חדש מאפל: גירסת אינטרנט של אפליקציית המפות

לבנות מפעל AI – ולהישאר בחיים

"המסע למימוש המלא של ה-AI יארך שנים"

סאפ מרחיבה את הפיטורים: יעמדו על עד 10,000 עובדים

מאסק טוען: "איני תורם 45 מיליון דולר בחודש ל-טראמפ"

בגלל ה-AI: וול סטריט רשמה את היום הגרוע בתולדותיה מאז 2022

סקירה: Lenovo Legion R45w-30 – מסך מחשב ענק

נשים ומחשבים: ד"ר טל ליבוביץ ריבקין, DenovAI

אולימפיאדת פריז 2024: אתגרי שמירת הנתונים והאבטחה

איך להיכנס לסטארט-אפ מבטיח בדיוק בזמן הנכון?

למה וויז אמרה "לא" לגוגל?

להיות או לחדול? מאי-וודאות להיערכות

מהפכת ה-GPT: לא הכול נוצץ

קח לך AI ובנה איתה בית: כך ה-AI משנה את תחום המשכנתאות

מחקר: AI יוצרת כמו ChatGPT עלולה לפלוט נתונים רגישים

"הקופסה השחורה" של ה-AI

תגובות

כתיבת תגובה לבטל

אירועים קרובים

תוכן פרסומי

תוכן פרסומי

תוכן פרסומי

ידיעות מובילות

מתחילת המלחמה: ממר"ם חוותה מעל 3 מיליארד ניסיונות תקיפה בסייבר

משקיע טק בכיר: אנבידיה עשויה להגיע לשווי של 50 טריליון דולר

נשים ומחשבים: אפרת פרקש, אוטוטוקס

אלון קור מונה ל-CTO של VMware ישראל

"המגזר הביטחוני יאיץ את יכולות ישראל ברובוטיקה, אוטונומיה ו-AI"

PwC Israel מדורגת ברשימת החברות המובילות בייעוץ וכמובילת ה-IT בארץ

תוכן פרסומי

שמנו לב שחוסם הפרסומות שלך מופעל