רדיט תובעת את אנת'רופיק: עשתה שימוש בנתוני משתמשיה לאימון AI

החברה שמאחורי הרשת החברתית בסגנון לוח המודעות, פתחה חזית משפטית נגד מפתחת מודלי הבינה המלאכותית, בטענה לשימוש לא מורשה בתכני משתמשים ● התביעה מצטרפת לשורת מאבקים דומים המתרחשים סביב תעשיית ה-AI הצומחת

תובעת את אנת'רופיק. רדיט.

החברה שמאחורי הרשת החברתית רדיט (Reddit) הגישה אתמול (ד') תביעה משפטית נגד חברת הסטארט-אפ אנת'רופיק (Anthropic), המתמחה בפיתוח מודלי בינה מלאכותית, בטענה ש-אנת'רופיק השתמשה באופן לא חוקי בתכנים מפלטפורמת רדיט כדי לאמן את מודלי ה-AI שלה, שהמוכר בהם הוא הכלי קלוד (Claude). התביעה הוגשה בבית המשפט העליון של קליפורניה בסן פרנסיסקו, שבה ממוקמים מטות שתי החברות במרחק דקות ספורות זה מזה.

לטענת רדיט, אנת'רופיק ביצעה "גירוד" (scraping) לא חוקי של תכנים שפורסמו בה, כולל תגובות ונתונים אישיים של משתמשים, ללא קבלת רשות או הסכמה. התובעת גורסת כי פעולותיה של אנת'רופיק הפרו את הסכם המשתמש שלה והתעלמו מפרוטוקולי שימוש בנתונים סטנדרטיים, כגון קובץ robots.txt, המנחה בוטים אילו תכנים אין לסרוק. לפי רדיט, הבוטים של אנת'רופיק עקפו מחסום זה ואספו כמויות גדולות של תוכן שנוצר בידי המשתמשים – תוכן שלטענת החברה הוא בעל "ערך מסחרי משמעותי".

עוד נטען בתביעה כי רדיט יצרה קשר עם אנת'רופיק כדי לנהל משא ומתן על תנאי שימוש, אך אנת'רופיק "סירבה להתקשר" ולהיכנס להסכם רישיון, שלא כמו גוגל ו-OpenAI, שאיתן רדיט כן חתמה על הסכמים.

האם הוא יעיד בתביעה? קלוד של אנת'רופיק.

האם הוא יעיד בתביעה? קלוד של אנת'רופיק. צילום: Shutterstock

קלוד בעצמו מעיד בתביעה

התביעה טוענת כי אנת'רופיק אימנה את הצ'טבוט שלה קלוד על נתוני רדיט למרות היעדר הסכם. הטענה בתיק היא שהבוטים של אנת'רופיק ניגשו לרדיט יותר מ-100,000 פעמים מאז יולי האחרון, לצורך אימון. 

אחת ההוכחות לכך, נטען, היא ש-קלוד מרבה להתייחס לקהילות ודיונים ספציפיים מ-רדיט. בתביעה אף מצוטט קלוד עצמו, שמודה כי אומן "לפחות על חלק מנתוני רדיט", בתוך שהוא מכיר באי ודאות לגבי השאלה האם התוכן ששימש לאימון שלו נמחק מאז. ממסמכים משפטיים עולה כי מחקר של אנת'רופיק משנת 2021, בו היה שותף מנכ"ל החברה דאריו אמודי, זיהה תת-פורומים (Subreddits) בפלטפורמת רדיט, כמכילים נתונים איכותיים.

החברה התובעת טוענת כי אנת'רופיק התעשרה ב"עשרות מיליארדי דולרים" באמצעות ניצול מסחרי של התכנים שגירדה. לפי רדיט, הנתונים נאספו על ידי כך שבוטים אוטומטיים ניגשו לתכניה למרות שהתבקשו לא לעשות זאת.

מעניין לציין כי התביעה הנוכחית אינה מתבססת על הפרת זכויות יוצרים, אלא מתמקדת בהפרה לכאורה של תנאי השימוש של רדיט ובתחרות הבלתי הוגנת שנוצרה כתוצאה מכך.

רדיט מבקשת כפיצויים שיחוזר לה הרווח הכספי שהשיגה אנת'רופיק, וצו מניעה קבוע שיאסור על הנתבעת להשתמש בתכניה בעתיד.

בתגובה לתביעה, דובר מטעם אנת'רופיק מסר כי החברה "חולקת על טענות רדיט ותגן על עצמה נמרצות".

תבעה את מטא ו-OpenAI על הפרת זכויות יוצרים. הכותבת והקומיקאית שרה סילברמן.

תבעה את מטא ו-OpenAI על הפרת זכויות יוצרים.
הכותבת והקומיקאית שרה סילברמן. צילום: ShutterStock

סוגיית האימון של מודלי ה-AI: מה לגיטימי ומה לאו?

התביעה של רדיט היא הראשונה מסוגה מצד פלטפורמת "ביג טק" נגד חברת AI, בנוגע לשימוש לא מורשה בנתונים שלה לשם אימון ה-AI. תביעה זו מתרחשת על רקע גנסיקה באקטים של "בדיקה משפטית" של סטארט-אפי בינה מלאכותית והתנהלותם.

תביעות בולטות אחרות בנדון כוללות את זו שהגיש הניו יורק טיימס נגד OpenAI ומיקרוסופט, את התביעה שהגישה הקומיקאית והסופרת שרה סילברמן ומחברים נוספים נגד OpenAI ומטא, ותביעות נוספות של אתרי תוכן ומוזיקה נגד פלטפורמות GenAI. כל המקרים הללו עוסקים בנושא הליבה – יוצרי תוכן הדורשים פיצוי הוגן לנוכח טענתם כי קניינם הרוחני שימש או משמש לאימון מודלי AI.

כאמור, רדיט עצמה כבר התמודדה בהצלחה עם הנושא והעניקה רישיונות לגישה אל נתונים למפתחות AI מרכזיות, בהן גוגל ו-OpenAI, כפי שציינו. שותפויות אלו מאפשרות שימוש בתוכן שמתפרסם ב-רדיט לטובת אימון AIמודלים, אך ההסכמה מתאפשרת "בתנאים נוקשים שנועדו להגן על פרטיות המשתמשים ולשמור על פרקטיקות נתונים אתיות".

ראש החטיבה המשפטית של רדיט, בן לי, הצהיר: "אנו מאמינים באינטרנט פתוח, אך חברות AI זקוקות למגבלות ברורות על האופן שבו הן משתמשות בתוכן שהן מגרדות". הוא הוסיף כי הסכמי הרישיון של הפלטפורמה החברתית עם חברות אחרות מאפשרים לה "להגן באופן משמעותי על המשתמשים שלנו, כולל הזכות למחוק את התוכן שלך, הגנות על פרטיות המשתמש ומניעת שליחת ספאם למשתמשים באמצעות תוכן זה". לי הדגיש את עמדת החברה בנוגע לבעלות על תוכן וציין: "לא נסבול ישויות, כמו אנת'רופיק, המחפשות רווח ומנצלות מסחרית תוכן של רדיט עבור מיליארדי דולרים – ללא כל תמורה למשתמשי רדיט או כבוד לפרטיותם".

תגובות

(0)

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אין לשלוח תגובות הכוללות דברי הסתה, דיבה, וסגנון החורג מהטעם הטוב

אירועים קרובים