ויקימדיה מעוניינת שתעשו שימוש בוויקינתונים

ויקינתונים הוא מסד נתונים חופשי, שיתופי ורב-לשוני, השייך לקרן ויקימדיה ישראל, ואשר התפתח בחמש השנים האחרונות ● ד"ר קרן שצמן, רכזת הפרויקט, מאיצה במנמ"רים ותיקים וביזמי היי-טק חדשים לעשות בו שימוש בכדי לספק שירותים שלא חשבו עליהם עד כה

ד"ר קרן שצמן, רכזת פרויקט ויקינתונים בעמותת ויקימדיה ישראל. צילום: אנדרה מולר

כאשר אתם כותבים חיפוש בגוגל, רואים בצד שמאל (בעברית) או ימין (בשפות שנכתבות משמאל לימין) תיבה ובה פרטים עיקריים על נושא מילת המפתח, אם זה אדם, חברה, יישוב, מדינה או כל ישות אחרת שיש לה ערך בוויקיפדיה. התמצית הזאת מגיעה ברובה מוויקיפדיה באמצעות פרויקט ויקינתונים, המכונה באנגלית Wikidata.

ולא רק גוגל, לא מכבר שמענו על ההודעה של Airbnb שהיא מחרימה את היישובים הישראליים בשטחים. מהיכן היא יודעת מהי התנחלות ומהו יישוב פלסטיני? הנתונים הגיעו מוויקינתונים, לפי ההגדרות של כותבי הערכים הרלוונטיים. בסופו של דבר היא נסוגה מהחלטה זו, משום שאינה מחילה אותה על שטחים אחרים במצב דומה, כגון צפון קפריסין וחבל נגורנו קרבאך בארמניה.

יש גם דוגמאות לשימוש שלא למטרת רווח. כך למשל פרויקט גנומיקס, שבו הועלו למסד הנתונים פרטי כל הגנים שפוענחו, מחיידקים ועד לבני אדם. כך לדוגמה יש פריט במסד הנתונים לכל גן שזוהה בפרויקט הגנום האנושי ובמחקרי ההמשך ועוד. דוגמה נוספת היא אתר היסטרופדיה – אתר המביא את אירועי ההיסטוריה בצורה מובנית יותר (קליק אחד לכל אירוע).

אלו הן רק דוגמאות לשימושים שונים במסד הנתונים הגדול שהתפתח בחמש השנים האחרונות. ד"ר קרן שצמן, רכזת פרויקט ויקינתונים בעמותת ויקימדיה ישראל, הסבירה בשיחה עם אנשים ומחשבים כיצד פועל המיזם והמליצה למנמ"רים ותיקים וליזמי היי-טק חדשים להשתמש בו, כדי לספק שירותים שלא חשבו עליהם עד כה.

"הרעיון של המיזם הוא – מסד נתונים ברישיון חופשי, כמו שוויקיפדיה היא אנציקלופדיה ברישיון חופשי. התחלנו את הפרויקט בהצגת המידע מכל הוויקיפדיות בעולם בצורה מובנית, כלומר להפוך אותו לנתונים. אם למשל בערך על אלברט איינשטיין כתוב מתי הוא נולד ואיפה הוא נולד, והיכן למד באוניברסיטה, בוויקינתונים הנתונים הללו יוצגו בצורה מובנית", אמרה שצמן.

גם מחשבים יכולים לקרוא את פריטי המידע

לפי שצמן, לא רק אנשים יכולים להשתמש בוויקינתונים, אלא גם מחשבים יכולים לקרוא את הפריטים הללו, וזה הופך את המיזם למעניין לא רק לקהל הרחב אלא גם לאנשי מחשבים.

פריט בוויקינתונים יכול לייצג כמעט כל כל נושא, מושג, אובייקט או ישות. לכל פריט יש מספר מזהה ייחודי (מספר Q), תווית (השם המקובל לפריט בשפה מסוימת), תיאור, כינויים (תוויות אלטרנטיביות) ומספר קביעות או הצהרות.

לדבריה, "קביעות מורכבות משלושה חלקים: (1) פריט (עם מספר Q ייחודי); (2) תכונה (בעלת מספר P ייחודי); (3) ערך (יכול להיות פריט אחר או איזשהו ערך אבסולוטי, כמו תאריך לידה, מספר, וכיו"ב). למשל: הולנד (Q55) – עיר בירה (P36) – אמסטרדם (Q727) או: אבי בליזובסקי (Q6946662) – תאריך לידה (P569) – ארבעה בנובמבר 1961".

"הנתונים בוויקינתונים נוצרו בהתחלה על בסיס כל הערכים שהיו קיימים בוויקיפדיות בשפות השונות", הרחיבה שצמן, "בשלב ראשון (סוף 2012) נוצרו פריטים במאגר הנתונים שכללו תחילה רק קישורים בין-לשוניים. כלומר, כל פריט שנוצר בוויקינתונים הכיל מידע בסיסי: תווית (השם המקובל לפריט בשפה מסוימת), תיאור וכינויים (תוויות אלטרנטיביות) וקישורים לערכים על הפריט בוויקיפדיות השונות.

בשלב שני, בתחילת 2013, החלו להוסיף הצהרות לפריטים. אלו יובאו, בחלקם בדרכים אוטומטיות, מתבניות מידע וקטגוריות שבערכי ויקיפדיה. בהמשך נוצרו פריטים והצהרות רבים על בסיס מאגרי נתונים חיצוניים (למשל, קישורים למאגרים חיצוניים כגון IMDB, קטלוגים של ספריות שונות, למ"סים במדינות שונות וכיו"ב), ומקורות מידע נוספים".

כל הנתונים זמינים ברישיון חופשי, כלומר ניתן לעשות בהם כל שימוש, כולל מסחרי. גוגל, אחת הנהנות הגדולות ביותר של הפרויקט, עושה שימוש בוויקינתונים: חלק נכבד מהמידע שמופיע בגרף הידע של גוגל נמשך מוויקינתונים. זו הסיבה שגוגל תמכו בהקמת מיזם ויקינתונים על ידי מענק שהיווה כרבע מההון ההתחלתי של המיזם.

מימוש החזון של ממציא האינטרנט

על אף שמיזם ויקינתונים הוא מיזם צעיר יחסית, הוא מעורר התעניינות והתלהבות בקרב גופים וארגונים שונים. הסיבה להתלהבות היא שיש לוויקינתונים את הפוטנציאל להוות תשתית לרשת סמנטית או Web 3.0 – מונח שטבע טים ברנרס-לי, שנודע כממציא רשת האינטרנט (WWW), ועומד בראש הארגון הבינלאומי לתקינה ברשת (W3C).

ב-2001 תיאר ברנרס-לי את חזון הרשת הסמנטית כבסיס נתונים שיפעל כרשת ויכיל את קשרי המשמעויות שבין מרכיביו. כלומר, מצב שבו מחשבים ויישומים ברשת האינטרנט יוכלו לנתח מידע ותכנים בצורה דומה לבני אדם על-ידי יצירת קשרים והקשרים בין כל התוכן הקיים ברחבי הרשת. רשת סמנטית יכולה להוות בסיס למערכות בינה מלאכותית ולשיפור רשת האינטרנט ומנועי החיפוש. הצלחת מיזם ויקינתונים יכולה, אם כן, להיות צעד משמעותי במימוש החזון של ברנרס-לי.

תגובות

(0)

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אין לשלוח תגובות הכוללות דברי הסתה, דיבה, וסגנון החורג מהטעם הטוב

אירועים קרובים