חוקרי AI הצליחו לדייק ב-93% בזיהוי הקלקות בזמן פגישות זום

מדובר בפרצה טכנולוגית משמעותית, משום שחוקרי הבינה המלאכותית שהצליחו לפענח לחיצות על מקשים דרך השמע בשיחות הווידיאו סבורים שהטכניקה הזו עלולה לייצר דרכים חדשות להונאות או מתקפות סייבר

עלולים להסגיר את הסודות שלנו. תקתוקי ההקלדה.

חוקרים בתחום ה-AI מכון המחקר האמריקני IEEE (ר"ת Institute of Electrical and Electronics Engineers) נרעשים מיכולתם לדייק ב-93% הצלחה זיהוי הקלדות על מחשב בזמן שיחות זום (Zoom), וזאת על בסיס אודיו ויכולות הבינה המלאכותית בלבד.

החוקרים השיגו את הדיוק המרשים בפענוח ההקלקות על המקלדות, כולל בפרטי הפרטים הטכניים שנמדדו, ביניהם זיהוי סגנונות הקלדה, סיסמאות עם תווים מעורבים ואף הקלקות במחשבים ניידים מסוגי לא מאוד נפוצים. למעשה, לדבריהם הם הצליחו להרכיב מודל למידה עמוקה שיודע לזהות סוגי מקשים שונים על פי הפרופילים הקוליים הייחודיים שלהם.

המחקר השווה את יכולות המודל החדש שפותח לנסיונות קודמים לפענוח של לחיצות מקשים בשיחות וידיאו (VoIP) בלעדי גישה פיזית למכשיר היעד, והסתבר שחל שדרוג ביכולות הללו, מ-91.7% דיוק בבדיקות על שיחות בסקייפ (Skype) בשנת 2017 ועוד יותר מכך מ-74.3% הדיוק שנרשמו בזיהוי הקלקות ב-VoIP ב-2018. אך יצוין כי צוות החוקרים ביצע את הניסוי באמצעות MacBook Pro משנת 2021, שעיצוב המקלדת שלו דומה מאוד לזה של הדגמים הקודמים בסדרה. 

מבחינה טכנית, באמצעות הכשרת מודל הלמידה העמוק שפותח ב-IEEE על צורות הגל הייחודיות הקשורות לכל מקש, החוקרים השיגו דיוק של למעלה מ-93% בהקלטת האודיו של תקתוקי המקלדת באמצעות מכשיר iPhone 13 mini, שנמצא במרחק של 17 ס"מ ממקור ההקלדה. באופן מדהים, בעת שימוש במיקרופונים המובנים של ה-MacBook והקלטה באמצעות שיחת זום, עם דיכוי רעשים מינימלי, הדיוק טיפס לרמה מדהימה של 95-96%.

מה שומעים מכם במהלכן? שיחות זום. אילוסטרציה.

מה שומעים מכם במהלכן? שיחות זום. אילוסטרציה. צילום: BigStock

סיכון פוטנציאלי לאבטחת המקלדות, המחשבים ומשתמשיהם

עורכי המחקר הסבירו כי שילוב של למידת מכונה, מיקרופונים ושיחות וידיאו יוצר סיכון פוטנציאלי לאבטחת המקלדות, המחשבים ומשתמשיהם.

לדברי החוקרים, מחקרם חשף פוטנציאל לפרצות אבטחה במערכות מידע והם הציעו אפשרויות הגנה כדי למנוע השגת גישה למידע הפרטי המסוים.

כדי להתמודד עם האיום המתהווה הזה, במחקר מוצעות מספר אסטרטגיות הגנה: ראשית, שינוי סגנון ההקלדה באופן תדיר; שנית, שימוש בסיסמאות אקראיות הכוללות תווים מעורבים; בנוסף, הכנסת הקשות שגויות שנוצרו באופן מלאכותי לאודיו המשודר במהלך שיחות וידיאו; ולבסוף – אימוץ כלי אימות ביומטרי כגון טביעת אצבע או זיהוי פנים, כחלופות לסיסמאות מוקלדות.

לדברי החוקרים, המחקר ותוצאותיו הם קריאת השכמה בכל הקשור בפגיעות מהתקפות של ערוץ צד מבוסס אודיו (Sound-based side channel attacks). הם סבורים כי הממצאים מדגישים את הצורך הדוחק בעירנות מתמשכת ובאמצעי אבטחה חדשניים ומתפתחים בנוף הדיגיטלי היותר ויותר מחובר ולנוכח התחכום ההולך ועולה של הבינה המלאכותית בתקופתנו.

תגובות

(1)

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אין לשלוח תגובות הכוללות דברי הסתה, דיבה, וסגנון החורג מהטעם הטוב

  1. אלי ויסברט

    יותר פשוט בפגישות זום, עסקיות ואחרות, שהסודיות יפה להם, שיוזם הפגישה ישבית את כל אמצעי הקלט של המשתתפים, כמו שחוסמים כיום רק את המקרופונים בזמן המפגש (מצב nute), למעט המצלמה. לגבי אירועים חברתיים ופחות משמעותיים להציג באנר ששימוש במקלדת מסכן את פרטיות המשתמש ועל אחריותו בלבד.

אירועים קרובים