DeepMind של גוגל שוקדת על פיתוח חיקוי לדיבור אנושי אמיתי

הפיתוח, המבוסס על טכנולוגיית הבינה המלאכותית, יאפשר לצ'אט בוטים לשוחח איתנו בדרך שבה נתקשה להבחין האם בן שיחנו הוא רובוט או בן אנוש ● יש כבר דוגמאות שניתן לשמוע באתר החברה

להחליף תהליכים ידניים. אילוסטרציה: BigStock

התרגלנו כבר לפטפט עם Siri או עם Cortana, העוזרות האישיות החינניות של אפל (Apple) ומיקרוסופט (Microsoft), בהתאמה, אבל עדיין די קל לנו לזהות אם נעננו עלי ידי בן אדם אמיתי או במענה ממוחשב ווקאלי.

כעת, תודות לפיתוח חדש מתחום הבינה המלאכותית המתקדם, המכונה בשם WaveNet, ואשר עליו שוקד צוות DeepMind של גוגל (Google) – אפשר כבר לנחש כי בעתיד יוכלו רובוטים מדברים להוליך שולל את מי שיאזין להם, כך שיחשוב שהוא משוחח עם אדם אמיתי.

ל-DeepMind יש רקורד די טוב בכל הנוגע בבניית רשתות עצביות – הם האנשים שיצרו את ה-AlphaGo, הבינה המלאכותית שהביסה את אחד משחקני Go הטובים בעולם.

נכון לעכשיו משתמשים מפתחים באחת משתי שיטות בכדי ליצור תכניות דיבור. אחת כרוכה בשימוש באוסף גדול של מילים ומטבעות לשון שבן אדם אחד אומר, מה שמקשה על התמרון בצלילים ובאינטונציה. השיטה השנייה מייצרת מילים באופן אלקטרוני, כפי שהן אמורות להישמע. שיטה זו קלה יותר לביצוע, אבל התוצאות שלה נשמעות הרבה יותר רובוטיות.

גלים כמו בתצוגת נגני האודיו

הפעם, על מנת לבנות תכנית דיבור שנשמעת אנושית באמת, הזין הצוות של DeepMind את הרשת העצבית בגלי אודיו (waveforms) שהוקלטו ממקורות אנושיים אמיתיים. ה-waveforms, הם אותם ייצוגים חזותיים של הצורות שהצליל מקבל. אנחנו מכירים אותם כגלים מעוותים המתפתלים ורוקדים לפי הקצב בתצוגה של חלק מנגני המדיה. בפיתוח שלה עוסקת WaveNet ביצירת גלי קול פרטיים לדיבור של האדם.

למשל, אם משתמשים בפיתוח כתכנית טקסט-לדיבור (text-to-speech program), הוא הופך את הטקסט שמקלידים לסדרה של הגאים והברות, ומשמיע אותם לאחר מכן. משתתפים שלקחו חלק במבחנים "עיוורים" חשבו שהתוצאות של WaveNet נשמעות אנושיות יותר מאשר בשיטות האחרות.

בפוסט שפרסמה DeepMind בנושא הבינה המלאכותית נאמר שהפיתוח יכול "לצמצם את הפער בין הביצוע העדכני ביותר לבין הביצועים ברמה האנושית ביותר מ-50%", וזאת בהתבסס על הניסויים שנערכו בשפות האנגלית והסינית המנדרינית.

השימוש באפליקציית WaveNet כחלק בלתי נפרד מחיינו עדיין רחוק, אבל ניתן כבר לשמוע מספר דוגמאות של הפיתוח באתר האינטרנט של DeepMind.

אגב, לבינה המלאכותית של החברה יש גם עתיד בתחום המוזיקה – הצוות הזין את היישום בקטעי פסנתר קלאסיים וזכה במספר דוגמאות מעניינות בפני עצמן.

תגובות

(0)

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אין לשלוח תגובות הכוללות דברי הסתה, דיבה, וסגנון החורג מהטעם הטוב

אירועים קרובים