אנציקלופדיית ביג דאטה: המקום ה-6 בתחרות הרעיונות

מאת: רועי גולן


דמיינו כמה נתונים מפוזרים כיום ברחבי העולם? הרי כולם אוספים "ביג דאטה" - מסוכנויות ביון, דרך כל הרשתות החברתיות ושאר התעשיות, המוסדות האזרחיים, הארגונים, העמותות, העיתונים וכמובן גופי המחקר. מה הם מחפשים שם בתוך ים הנתונים הללו? תובנות קריטיות יותר או פחות בעבור הפעילות שלהם, כאלה שיאפשרו להם לממש את הייעוד שלהם - בין אם הוא מתחום המשילות, הכלכלה או שיפור העולם - בצורה הטובה ביותר. כל הארגונים האלה משקיעים אוקיינוס של זמן וכסף באיסוף, ניתוח, ויזואליזציה והמרה של הנתונים לתובנות פרקטיות.


קרדיט: Orbon Alija / Getty Images



מי שמספק את הנתונים האלה הם אנחנו, בעוד שהמקור - כלומר אנחנו - נאלצים להסתפק בשאריות שמושלכות לעברנו. כל מיני תובנות חצי מובנות על נושאים שלאו דווקא חשובים לנו, או כותרות מוטות ופשטניות שלעתים קרובות גם סותרות זו את זו. לפעמים אנחנו מקבלים איזו אינפוגרפיקה צבעונית ולא יותר. כשאנחנו רוצים ללמוד באמת על נושא מסוים עם אופי מדעי וסטטיסטי, אנחנו צריכים לשבור את הראש על גוגל וויקיפדיה, לצלוח מידע כוזב וסותר ממקורות לא ברורים, לעתים קרובות ללא מגובה בנתונים או בלי יכולת להבין את הנתונים המוצגים, בזמן שאלה נמצאים ממש לידינו רק בלתי נגישים בעבורנו. 


כך, אנחנו נאלצים לזגזג בין אתרים בארץ ובעולם כדי לקבל את כל התמונה שמעניינת אותנו, את כל הגרפים שחשובים לנו כדי להבין ולדעת בדיוק מה הניקוד המלא של Humanity VS COVID19 - וגם אז חסר לנו מידע חיוני. דוגמה: נסו להבין לבד מה רמת הצריכה של ויטמין C בקרב שורדי קורונה ביחס לאלה שמתו. או במלים אחרות: האם ויטמין C יכול לעזור לריפוי המחלה? בהצלחה עם מאות פריטי המידע הסותרים, הנתונים שהיה אפשר לסכם בגרף פשוט אחד ואולי להציל באמצעותו חיים, או לחלופין לחסוך כסף מיותר על מוצר מסחרי עם מיתוג מבריק.


גם אחרי שנוצר האינטרנט, המציאות היא שקשה למצוא בו את כל המידע הסטטיסטי הדרוש לנו. נכון שאחת היצירות האנושיות הגדולות ביותר עד כה - ויקיפדיה - שינתה את הכללים ושחררה להמונים מידע מהימן וחשוב. אבל הגיע הזמן לעבור לשלב הבא של אנציקלופדיות ההמונים. הכוח שלנו כאנושות, כיצורים משתפים, בצירוף הצעצוע ההיסטורי הזה שנקרא "אינטרנט", רק מתחיל להתגלות. יצרנו מסמך עצום ומרגש, בן מיליארדים של מילים, שיכול לבדו למלא ספריות ומשמש את כולנו בכל יום. עשינו את זה ביחד. בואו נעשה ביחד גם את הדבר הבא, והפעם עם הנתונים הסטטיסטיים ששייכים לכולנו.



מה זה ביג דאטה?


למה שלא נאגד את כל שאלוני המחקר, שחברות וארגונים כה רבים מתאמצים שנענה עליהם, ואת כל אספני הנתונים האוטומטיים, ונוודא שכשמקבלים מאיתנו נתונים, גם מחזירים לנו אותם ארוזים יפה, בגרפים מדויקים ומגוונים, בצורה שנוכל להבין? למה שלא נאחד את כל הנתונים של גופים שמעוניינים בטובת הכלל וננגיש אותם לקהילה, כך שגם תלמידת כיתה ה' שעושה עבודה על תזונה וגם דוקטורנטית במדעי המוח, יוכלו להגיע למטרות שלהן מהר יותר?


ביחד אפשר ליצור מרחב מאוחד לאיסוף, ניתוח, שיתוף והצגה נגישה של נתונים סטטיסטיים. כזה שגדל וצומח תוך כדי שימוש, כזה שמהווה יצירה אנושית שיתופית לטובת הכלל, וכזה שנתון לביקורת עמיתים והמונים תמידית, כך שהוא יהיה תמיד אמין ומדויק. באופן הזה, כל אחד ואחת מאיתנו יוכלו למצוא את הנתונים שהם צריכים בקלות ולראות אותם בעיניהם בתוך שניות.


דמיינו את הקלות שבה אפשר לצפות בדאשבורד מאוחד של כל נתוני הקורונה שאפשר להעלות על הדעת, בלי תיווך של גופי תקשורת. במקום להפיץ את הסקר הזה שביקשו מאיתנו ליצור עבור התואר באוניברסיטה, בואו ניכנס לאנציקלופדיית ההמונים החדשה ונמצא בה את התשובות של כל הסקרים הזהים הקודמים - ואז נהיה פנויים לחשוב על סקר חדש, כזה שגם מסתמך על מה שכבר נעשה וגם מוסיף זווית חדשה לגמרי.


נניח שאתם מעוניינים לברר בעצמכם את מצב המיניות בעולם - כמה מאיתנו חווים קושי בתחום המיני ומאילו סיבות. או מה מצב הסמים שלנו - לכמה מאיתנו הם הרסו את החיים ואיזה סוג של אנשים דווקא השתחררו בזכותם. כמה מאיתנו מתבאסים שלא למדו לנגן על כלי נגינה, למה אנחנו חושבים שזה כבר לא אפשרי בגיל מבוגר, וכמה מאיתנו מוכיחים שזה כן אפשרי דווקא בגיל 50; באיזו שכונות גרים האנשים הכי בריאים ומה הם לא אוכלים אף פעם; מה קורה לנו באזורים עמוסי קרינה סלולרית; מה צפייה בטלוויזיה באמת עושה לילדים שלנו ומה היא עשתה לנו; באיזו עיר נשים מרגישות הכי בטוחות; מה באמת יכול לעזור לנו להימנע מקורונה ובכלל ממחלות ויראליות; וכן, לעזאזל, אחת ולתמיד, גם להבין אם כדאי לשתות את הקפה הזה או לא.


המטרה שלנו היא לענות לעצמנו על כל אחת מהשאלות האלה, ולא כאייטם חדשותי עסיסי שמחר מתחלף, אלא כמחקר מעמיק, מתרחב ומתמשך. ההצעה שלי, WeSee, תיצור ים גדול של נתונים סטטיסטים מסודרים וצבעוניים כדי שכולנו נוכל להבין. הם יהיו פתוחים ונגישים לכו-לם, כדי שסוף-סוף נבין באמת, ללא תיווך של בעלי אינטרסים, מה עושה אותנו בריאים ומאושרים יותר. ואז נוכל ללמוד לשחות בים הזה יותר טוב. ביחד נוכל להגיע לתובנות ביג דאטה איכותיות משלנו כי הן מגיעות גם לנו, הן קריטיות עבור הפעילות שלנו, והן יאפשרו לנו לממש את הייעוד שלנו בצורה הטובה ביותר.


הכותב הוא מקים-שותף בקואופרטיב התוכנה SOFI, חברה בבעלות משותפת של העובדים, המייצרת אפליקציות ומערכות מידע עבור פרויקטים חברתיים וסביבתיים


לתחרות הוגשו כ-700 הצעות ומתוכן בחר חבר השופטים עשר הצעות, כששלושת המקומות הראשונים זכו בפרס כספי מטעם ארגון "הברית הישראלית".


חבר השופטים בתחרות "רדיקל" בשיתוף "הארץ": איתמר ויצמן, יאיר אסולין, להב הלוי, לי ירון, ליהיא סקולר, עפרי אילני, נטע אחיטוב ועמית נויפלד. 

רדיקל הוא פרויקט מבית הברית הישראלית