מטא "מקרבת את האנושות": השיקה כלי תרגום חדשני לכ-100 שפות

SeamlessM4T הוא מודל AI חדש שיכול לבצע מספר פעולות יחד - זיהוי דיבור, תרגום דיבור לטקסט, תרגום דיבור לדיבור, תרגום טקסט לטקסט ותרגום טקסט לדיבור

תאחד את העולם עם מודל ה-AI לתרגום שפה דיבור שלה? מטא.

מכירים את המצב שבו אתם יושבים במסעדה בחו"ל ולידכם יש תיירים מארץ אחרת, שמדברים שפה זרה מאוד לאוזניכם, אבל ניכר כי שני הצדדים רוצים לפטפט ולהכיר? פתחתם תרגום גוגל וה"שיחה" הייתה חביבה אך מקרטעת? החברה האם של פייסבוק רוצה לטפל בדיוק בכך עם כלי חדש שהוציאה.

מטא (Meta) – שהיא גם החברה האם של אינסטגרם, ת'רדס, ווטסאפ ואחרות – השיקה באחרונה את SeamlessM4T, מודל AI חדש שיכול לתרגם דיבור וטקסט בכמעט 100 שפות. החידוש במוצר הוא שמדובר במודל יחיד שיכול לבצע מספר פעולות יחד – זיהוי דיבור, תרגום דיבור לטקסט, תרגום דיבור לדיבור, תרגום טקסט לטקסט ותרגום טקסט לדיבור.

לטענת מטא, SeamlessM4T מדויק ויעיל יותר מדגמי תרגום קודמים, וניתן להשתמש בו כדי לתקשר ממש בזמן אמת עם אנשים הדוברים שפות שונות.

מטא גם בישרה שהיא הופכת את SeamlessM4T לזמין לחוקרים ולמפתחים תחת רישיון מחקר, ולדבריה SeamlessM4T הוא צעד משמעותי לקראת יצירת מתרגם שפה אוניברסלי.

המודל של מטא הוכשר על מערך נתונים של מאות אלפי שעות דיבור וטקסט בשפות השונות ולמעשה בנוי על העבודה הקודמת של מטא בנושא ששמו המעניין הוא 'אין שפה שתשאר מאחור' – NLLB (ר"ת No Language Left Behind) – מתרגם דיבור אוניברסלי ורב-לשוני.

קוד פתוח כדי לקרב את בני כל העמים אלו לאלו

בפוסט בבלוג ה-AI שלה ציינה החברה כי היא מאפשרת נגישות למודל המוצע בקוד פתוח.

"בהתאם לגישה שלנו למדע פתוח, אנו משחררים בפומבי את SeamlessM4T תחת CC BY-NC 4.0, כדי לאפשר לחוקרים ולמפתחים להתבסס על עבודה זו. אנחנו גם משחררים את המטא נתונים של SeamlessAlign, מערך התרגום הרב-מודאלי הפתוח הגדול ביותר עד כה, הכולל 270,000 שעות של דיבור וטקסט" כדי להבהיר מה היו התכנים שעליהם אומנה הבינה המלאכותית כתבה השתמשה מטא במונחים Text alignments ו-Mined speech.

בפן הטכני ציינה מטא כי "בניית מודל מאוחד דורשת ערכת כלים למידול רצפים שתהיה קלת משקל וניתנת לחיבור בקלות עם ספריות אקולוגיות מודרניות אחרות של PyTorch. עיצבנו מחדש את fairseq, ערכת הכלים המקורית שלנו למידול רצף. עם ממשקי API יעילים יותר של מידול והעמסת נתונים, fairseq2 עוזרת להפעיל את המודלים שמאחורי SeamlessM4T".

SeamlessM4T.

SeamlessM4T. צילום: מטא

"העולם בו אנו חיים מעולם לא היה מחובר יותר, נותן לאנשים גישה לתוכן רב-לשוני יותר מאי פעם. זה גם הופך את היכולת לתקשר ולהבין מידע בכל שפה ליותר ויותר חשובה", הסבירה מטא בהצהרה על הכלי.

לדברי מטא, צוותי הפיתוח שלה מתכננים לחקור כיצד ניתן להשתמש ב-SeamlessM4T כדי לאפשר יכולות תקשורת חדשות בין בני האדם בעתיד.

המטרה הזו מתכתבת היטב עם סלוגן ותיק מבית הענקית ממאנלו פארק שדיבר על כוונתה לחבר את האנושות ולקרב את בני כל העמים, הארצות, הדתות, האמונות והמוצאים אלו לאלו.

תגובות

(0)

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אין לשלוח תגובות הכוללות דברי הסתה, דיבה, וסגנון החורג מהטעם הטוב

אירועים קרובים