העתיד טמון במכונות הלומדות בעצמן, במקום בלימוד מכונה מונחה

כך אומר פרופ' שוקה זאבי, ראש המרכז לראייה ומדעי התמונה בטכניון, וממייסדי חברת קורטיקה, שטוענת לפיתוח מכונה לומדת עם מעט מאוד עזרה אנושית

פרופ' שוקה זאבי, ראש המרכז לראייה ומדעי התמונה בטכניון וממייסדי קורטיקה. צילום: יח"צ

"העתיד טמון במכונות הלומדות בעצמן, במקום בלימוד מכונה מונחה", כך אומר פרופ' שוקה זאבי, ראש המרכז לראייה ומדעי התמונה בטכניון וממייסדי קורטיקה, בראיון לאנשים ומחשבים.

"העיסוק שלי הוא בהבנה של מערכות ראיה טבעיות ופיתוח מערכות ראיה טכנולוגיות – או מערכות שעוסקות בפיתוח תמונות בהשראת הרעיונות שאנחנו שואבים ממערכות ראייה טבעיות", אמר זאבי. "כעת אני עוסק במחקר בתחום התבונה המלאכותית, ובמסגרת המחקר שיתפתי פעולה עם ביולוגים וחקרנו רקמה עצבית שנלקחה מקליפת המוח של חולדה, בעל חיים בעל יכולות ראייה גבוהות שלא טריוויאלי ליישם אותן במערכות טכנולוגיות".

"ממחקר זה צמחה ב-2007 חברת קורטיקה, שאליה הגעתי אני מתחום מדעי המחשב והראייה ממוחשבת; קארינה אודינייב, שהגיעה מתחומי הרפואה ומדעי המוח; ויגאל רייחלגאוז, שהגיע מתחום הנדסת החשמל. החברה רשמה עד כה כ-200 פטנטים. בדקנו כיצד מגיבה רקמה חיה כזו לאותות שונים שמזינים אליה באמצעות אלקטרודות, ובאותה צורה גם קולטים תגובות מתאים אחרים. מזה הגענו למסקנות מרחיקות לכת לגבי מה שיכול להיות האלגוריתם שלפיו מתבטאים דברים מאוד מורכבים ברקמה הזו. וגם אם הוא לא האלגוריתם המדויק במוח של החולדה, הרי שבמערכות לימוד המכונה הוא עשוי להיות מעניין.

למידה עמוקה פועלת כמערכת רב-שכבתית

ארכיטקטורת הלמידה העמוקה השולטת היום פועלת כמערכת רב-שכבתית, המכילה מאות שכבות וכל שכבה משפרת את הדיוק של מה שחושבת השכבה שמעליה. הזמינות של כוח חישוב כמעט אינסופי בחוות שרתים כמו שיש לגוגל (Google), לדוגמה, אפשרה להגדיל את מספר השכבות, אבל הביאה את לימוד המכונה לפינה. ברקמת המוח אין שכבות. יש שם אוסף תאים שמתארגנים ומבצעים את החישובים.

יגאל רייחלגאוז וקרינה אודינייב, המייסדים הנוספים של קורטיקה. צילום: יח"צ

יגאל רייחלגאוז וקארינה אודינייב, המייסדים הנוספים של קורטיקה. צילום: יח"צ

באבולוציה מהמכרסמים ועד הקופים לא ראינו שמספר השכבות בקליפת המוח גדל משמעותית. הדבר היחיד שגדל עם גודל הקופסה (הגולגולת) הוא היכולת להכניס כוח חישוב לשטח קליפת המוח. במקום שכבות ראינו במוח הרבה מעבדים שעובדים במקביל, והם לא הכי מדויקים. הם מחלצים מאפיינים פשוטים מהעולם החיצוני ובאמצעות ריבוי של מעבדים פשוטים שמבצעים את אותה משימה במקביל מגיעים לתוצאות בכל דיוק שהמשתמש ידרוש.

פיתחנו ארכיטקטורה ואלגוריתמים שמתאימים לטיפול בכל אות טבעי, דיבור, אות של מכ"מ, תמונה, קולות ממיקרופון או כל חיישן אחר, וכן לערוך חיפוש בביג דטה – נתונים שאף פעם לא היו מסודרים ונגישים ולמצוא שם אוצרות – למשל ניתוח של נתונים רפואיים וזיהוי תבניות – בין אם אלו סימנים מוכרים של מחלות ובין אם איתור משהו שלא היה ידוע עד קודם באמצעות ניתוח ההדמיות הרפואיות.

מערכות לימוד מכונה יכולה להיות מונחית מומחה או לא מונחית מומחה, Supervised או Unsupervised. תאר לעצמך מצלמה שנמצאת במכונית, ברחפן או בכל פלטפורמה ניידת אחרת. המצלמה נחשפת לעולם כמו שילדים נחשפים לעולם, בלי שכל פעם אומרים להם מה שמו של העצם. המערכת לבדה מוצאת את העצמים, יודעת להבדיל ביניהם, ולבסוף אנו נותנים לה תיאורים מילוליים בעזרת שפה".

תהליך דו שלבי של זיהוי ואישכול

"יש כאן שני שלבים – התהליך של הזיהוי והאישכול (Clustering) – והשלב השני הוא התיוג של האשכול במושג הלקוח מהשפה – זה כסף, זה כובע, זה סימן של גידול ממאיר וכדומה. כאשר מנסים לפתח מערכות זיהוי תמונות כמו שיש לגוגל, נדרשים למאות מיליוני מושגים. אבל אם מפתחים בשיטה זו את מערכת הראייה של המכונית החכמה – אז אתה צריך עולם מושגים אחד. אם אתה מפתח את זה לטלפון הנייד לצורך תיירות, אתה צריך עולם מושגים אחר, ואם מפתחים את זה לקניות – שוב עולם אחר של מושגים, כנ"ל עולם הרפואה.

הבעיה שגוגל החביאו מאחורי המערכת לזיהוי חתולים עשרות אלפי מעבדים כבדים. אם צריך כל כך הרבה מעבדים בעבור מושג אחד, צא ולמד איפה זה ייגמר כשנצטרך מאות מיליוני מושגים.

אנחנו הצלחנו לפתח מערכת ראייה ממוחשבת למכונית אוטונומית היושבת על PC רגיל, עם מעבדים גרפיים חזקים, מאפשרים לה לזהות את הסביבה ולהבין מהם רמזורים, הולכי רגל, מכוניות אחרות וכלי רכב דו-גלגליים".

התוכנה מסתכלת על העולם ומזהה תמונות

ועל כך הוסיף מנכ"ל קורטיקה יגאל רייחלגאוז והרחיב "אנחנו פשוט משחררים את התוכנה להסתכל על העולם, על הרבה תמונות אקראיות, והמערכת מתחלה לחפש את הדברים המשותפים בתוך המידע האקראי. היא פשוט תזהה שיש בין תמונות שונות משהו משותף שנראה אותו דבר, תקלסטר אותן, תצליח לייצר קבוצה נפרדת של התמונות האלה, ותייצר להם ייצוג".

איך אתם מסתדרים עם כך שהתוכנה יודעת שזה משהו נפרד אבל לא בהכרח שזה חתול?
"גם במקרה של מכונה רגילה צריכים להיות תגים, וזה התנאי. תינוק יודע לזהות משהו, ואומרים לו שזה חתול. מעתה והלאה הוא יידע שלייצוג הזה קוראים חתול. כך גם המכונה".

יש אינסוף צורות בטבע?
"לא מדובר באינסוף. יש הרבה מאוד אובייקטים והרבה דברים שיכולם להיות זהים בין התמונות. יש הרבה אובייקטים שכיחים והרבה מאוד נדירים. המערכת תזהה את כולם, אבל צריך לתייג לה רק את מה שרלוונטי לאפליקציה".

תגובות

(0)

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אין לשלוח תגובות הכוללות דברי הסתה, דיבה, וסגנון החורג מהטעם הטוב

אירועים קרובים