- אנשים ומחשבים – פורטל חדשות היי-טק, מיחשוב, טלקום, טכנולוגיות - https://www.pc.co.il -

"ישנה התאמה חזקה בין כמות המידע המנותח לפריצות דרך מדעיות"

"אין חשיבות לכמות המידע שנאסף. ישנה הלימה, התאמה חזקה בין כמות המידע המנותח – לבין פריצות דרך המחקר המדעי. אולם, לא ניתן לנתח את המידע בצורה נאותה – בלא תשתית מידע נכונה ומתאימה", כך אמר ד"ר נדב קליין, CTO ב-VLX Ventures.

ד"ר קליין דיבר בפתח כנס BI & Big Data 2017. הכנס, בהפקת אנשים ומחשבים, נערך היום (א'), באולם אירועים LAGO בראשון לציון. בכנס השתתפו מאות מקצועני BI ו-Big Data, והנחה אותו אמיר רסקין, שותף ב-B-Pro.

קליין, ד"ר לביו-סטטיסטיקה, אמר כי "ישנם סוגים רבים של מידע ביולוגי אשר נפוצים במגוון הולך וגובר של תעשיות ותחומים: מחקלאות, דרך אנרגיה ומזון, וכלה במחקר רפואי וביולוגי גרידא. המרתקים שבהם אשר צוברים תאוצה בימים אלו – הם ביו-אינפורמטיקה, כימיאינפורמטיקה, פרוטאומיקס, מיקרוביום, ביו-סנסורים, מדעי המוח, medical imaging ורובוטיקה".

הוא תיאר בפני המשתתפים מהו מידע ביולוגי: "כזה הנוגע למבנה המולקולות ולקשרים ביניהן, מידע הנוגע לתהליכים בגוף, מידע על מבנה חלבונים, על 'קהילות' של חיידקים, מידע המופק מחיישנים ביולוגיים, ומידע הקשור למחקר נוירולוגי". לצד אלה, ציין, "ישנם סוגי מידע רפואי אחרים, דוגמת מידע המגיע מנתוני דימות, רשומות רפואיות, טלה-רפואה ועוד".

"כמות המידע שאנו מתמודדים עימה בעולם הביולוגי היא רבה", אמר ד"ר קליין, "המספרים בתחום הופכים מרשימים יותר ויותר. הם נמצאים בהלימה עם הגידול המעריכי (האקספוננציאלי) בכמויות המידע שנאספות גם בתחומים אחרים. כך, בשדה הביולוגיה, תשעה פטה בייט של נתונים נאספים מדי יום, לעומת סך המידע שנאסף בתחומים אחרים, אשר נושק ל-2.5 אקסה בייט".

מנצלים את מלוא הפוטנציאל של המידע

כיום, אמר ד"ר קליין, "ישנם כ-8,000 פטה בייט של מידע ביולוגי זמין, כאשר כמעט מחציתו נאסף בשנת 2016. עם זאת, ישנה מגמה הולכת וגוברת של מידע שלא מנותח – למרות שישנה קורלציה חזקה בין כמות המידע המנותח, לכמות ההישגים המדעיים אשר העולם הביולוגי מגיע אליהם".

המחקר אותו הוא הוביל, אמר ד"ר קליין, "עסק בניתוח גנומים אוטיסטיים, באמצעות אלגוריתמי לימוד מעמיק בשם Boltzmann Machines ו-Hopfield nets. במסגרת המחקר, שנערך ב-2011, נתקלנו בקשיים בכל הנוגע לתשתיות המידע שהיו זמינות – העברת המידע, ניקיון המידע והתאמתו לסטנדרטים אחידים, כתיבת הקוד החדשני (קוד פתוח היה רק בראשיתו), והרצת האלגוריתמים בפועל על כלי מחשוב חזקים מספיק".

לדבריו, "העולם הביולוגי זיהה בדיוק את אותן בעיות שאנחנו חווינו ועשה התאמות, על מנת לעשות אופטימיזציה לתהליכי מחקר דומים".

"אותם שינויים, אשר הבשילו לקראת אמצע 2013, איפשרו לנו להגיע לפריצות דרך במחקר ולהגיע להישגים משמעותיים: סביבות ענן שמסוגלות להחזיק מידע ולהריץ אותו ובעלות משאבים כמעט בלתי מוגבלים, פרוטוקלי תקשורת מותאמים ספציפית להעברת כמויות עצומות של מידע בצורה מהימנה, הצטרפות לקהילת הקוד הפתוח ושיתופי פעולה אקדמיים בהתאם, ועוד".

"יש התאמה בין כמות מידע שנותח וכמות פריצות דרך מדעיות", סיכם ד"ר קליין. "אין התאמה בין כמות מידע אשר נאסף – ולא נותח – ובין פריצות דרך מדעיות".

"כמויות המידע שאנחנו מייצרים הולכות וגדלות מדי שנה, ועלינו להתאים את הכלים והדוקטרינות שאנו משתמשים בהם בצורה רציפה – על מנת לוודא שאנחנו מנצלים את מלוא הפוטנציאל של המידע ושלנו כחברה".