"הטכנולוגיה משנה את העולם; אין יותר 'אם' – יש 'מתי'"

כך אמר אנדי ג'סי, מנכ"ל AWS, בכנס השנתי Re:Invent ● לדבריו, "את מה שפעם היה נראה לנו כמו מדע בדיוני, מבקשת אמזון להפוך למציאות"

אנדי ג'סי, מנכ"ל AWS. צילום: אור יעקב

לימוד מכונה (Machine Learning) הוא דבר שכולנו – אלא אם אנחנו מנותקים לחלוטין מהציוויליזציה – משתמשים בו. גם אם אנחנו לא מודעים לזה, הרי שהיכולות של תוכנות לחזות את הרצונות שלנו, בין אם מדובר בסרט הבא שנטפליקס (Netflix) טוענת שיהיה לטעמנו, או האלגוריתם של גוגל (Google) שמבקש למצוא את מה שאנחנו מחפשים עוד לפני שאנחנו הבנו מהו בכלל.

מי שמבקשת לעשות צעדים חזקים בנושא היא AWS, שערכה השבוע בלאס וגאס את הכנס השנתי שלה, Re:Invent, בו לקחו חלק 32 אלף משתתפים, בין אם מדובר בלקוחות, משתמשים, שותפים ושאר אנשי מקצוע.

במהלך הכנס הכריזה החברה על מגוון רחב של שירותים ומוצרים חדשים, וננסה לסקור את רובן במהלך השבוע הקרוב, ונתחיל כאמור, בתחום שהוזכר בפסקה הקודמת, עליו אמר מנכ"ל החברה, אנדי ג'סי, כי "הרבה חברות לא מבינות את המורשת שיש לאמזון בתחום לימוד המכונה".

אנדי ג'סי, מנכ"ל AWS, במסגרת ההרצאה הראשית הראשונה בכנס. צילום: עופר פרוסנר

אנדי ג'סי, מנכ"ל AWS, במסגרת ההרצאה הראשית הראשונה בכנס. צילום: עופר פרוסנר

ג'סי דיבר במסגרת ההרצאה הראשית הראשונה בכנס, והציג שלושה מוצרים חדשים שבאמצעותם היא מבקשת לחזק את המעמד שלה בהקשר הזה. הראשון, Amazaon Rekognition, הוא כלי שמזהה תמונות (Images).

התהליך מתחיל ברגע שהמשתמש מעלה תמונה אל הרקוגנישן, שמסוגלת לזהות, בין השאר, אובייקטים שונים, סצנות ורקעים, ואף לערוך סריקות לזיהוי פני אדם. על פניו, מדובר בכלי שהשימושים יכולים להיות נרחבים, החל משימושי ביטחון שונים במעברי גבול או עבור סוכנויות שיטור, ועד דברים פרוזאיים יותר, כמו יצירת שאזאם לאלבומי תמונות בזמן שסורקים ומעלים אותם לפורמט דיגיטלי. ג'סי הבטיח בדבריו שמדובר בשירות שיהיה גם קל לשימוש וגם עם מחיר נוח.

הלימוד אינו מפסיק

המוצר הבא עליו הכריז המנכ"ל היה Amazon Polly, שירות של טקסט לדיבור, שהכח המניע מאחוריו הוא למידה עמוקה. מה שפולי עושה, בקיצור נמרץ, הוא לקחת טקסט – כל טקסט – ולהפוך אותו לקובץ קולי (mp3) ב-47 קולות שונים וב-24 שפות, כשהקובץ המדובר ניתן להשמעה חוזרת ללא הגבלה.

אבל העניין החשוב ב-Polly הוא הלימוד העמוק: כך למשל, מסוגל השירות להבין קיצורים שונים – למשל, אם בטקסט יהיה כתוב San Francisco, CA, הקול לא יגיד "קא" אלא יבין שמדובר בקיצור לקליפורניה, באמצעות ההקשר.

Polly, הסביר ג'סי על הבמה, מסוגל להבין בצורה טבעית את התוכן, ו"לתרגם" אותו לדיבור, והלימוד הזה אינו מפסיק. גם כאן השימושים הם נרחבים, כשכלי תקשורת שונים (באמזון נותנים לדוגמא את הוושינגטון פוסט, שנמצא בבעלותו של ג'ף בזוס, יושב ראש אמזון המייסדת של AWS), הופכים למשתמשים עיקריים. עצם העובדה שסיפורים כתובים יכולים להפוך לקבצי קול, יכולה לשנות את הדרך שבה צורכים סיפורים תקשורתיים, כולל בעתיד אולי את הכתבה שאתם קוראים עכשיו.

לא מדע בדיוני

המוצר השלישי היה Amazon Lex, שבפועל פחות חדש, אבל עדיין שווה להתמקד עליו כדי להבין במה מדובר. Lex מספק הבנה של שפה טבעית וזיהוי דיבור אוטומטי. גם הוא, כמו Polly, מונע על ידי למידה עמוקה. אם הכלי הזה נשמע לכם מוכר, הרי שמדובר במנוע של Alexa, העוזרת האישית של אמזון. ג'סי הסביר שמדובר בכלי ש"יתן לאמזון את היכולת לבנות מגוון רחב של אפליקציות לשיחות".

ההדגמה של ה-Lex על הבמה הייתה מרשימה במיוחד: פעולות שהיום דורשות מאיתנו לפתוח מחשב או אפליקציה, יכולות – לפי החזון של אמזון – להיעשות באמצעות דיבור בלבד.

אמזון מבקשת, באמצעות שלושת הכלים שלה, לשנות לא רק את הדרך שבה הטכנולוגיה עובדת, אלא גם את הדרך בה המשתמשים מתממשקים עם הטכנולוגיה, ואת כל האינטראקציה שלהם איתה.

אחד הדברים המעניינים שג'סי סיים איתם את ההרצאה שלו, היה בפועל משפט על ההתקדמות הטכנולוגית: "הטכנולוגיה משנה את העולם, ובמקום לשאול 'אם' אנחנו שואלים 'מתי'" – את מה שפעם היה נראה לנו כמו מדע בדיוני, מבקשת אמזון להפוך למציאות. בטוח שיהיה מעניין.

תגובות

(0)

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אין לשלוח תגובות הכוללות דברי הסתה, דיבה, וסגנון החורג מהטעם הטוב

אירועים קרובים