קורונה והסדנא: ההחלטה לא לפרסם דיווחים גולמיים

היי לכולם,
מזמין את @noam לשתף אותנו ולספר לנו על נושא פרסום הדאטה של השאלונים של הקורונה.

רקע: הפוסט שלי בעניין, והתגובות של נועם כאן וכאן.

נועם, הבמה שלך…

עדכון: הפוסט נעול בפני כך שאני לא יכול להגיב. מישהו יודע למה זה קרה?
עדכון נוסף: הפוסט נפתח בשבילי לעריכה. כנראה תקלה טכנית.

@Ofer_Bartal

אשמח להסביר ולשתף בדילמות שליוו אותנו, מבלי לשחזר ולחזור על מה שכבר נכתב באתר עצמו או בדוקומנטציה של הקוד או במאגר הנתונים הזמינים להורדה.

כמובן שאני לא מקבל את ההגדרה המקדמית שלך לגבי “החלטות לשחרור או אי-שחרור של דאטה”. כשהנתונים המדוברים הם רשומות של מידע רפואי פרטי שניתן במסגרת התחייבות שלנו למשתמשים לשמור על פרטיותם, אין פה לדעתי היבט של “שחרור”. המדובר בדיווח וולונטרי של משתמשים על מצבם הרפואי, שנמסך על סמך התחייבות של האתר להקפיד על פרטיותם (ומאמץ פיתוחי רב שהושקע בלאפשר זאת). המידע נאסף במסגרת ניסיון לבסס אווירה של אמון ושיתוף פעולה חברתי אל מול חששות (מוצדקים מאוד, כפי שראינו בהמשך בזירה הלאומית) ממעקב אזרחי או ניהול לא אחראי של נתונים מסוג זה וההצהרה המפורשת היתה שיעשה בו שימוש לצורך ממוקד ומוגדר של מחקר אקדמי לצורך ניבוי התפרצויות אזוריות של המחלה.

תוכל למצוא את הביטוי המשפטי של זה במדיניות הפרטיות שפרסמנו, ובהתחייבות הכפולה שמופיעה שם לא רק להמנע ככל שניתן מאיסוף פרטים מזהים, אלא גם בבקרה על הגורמים שיעשו שיחשפו לנתונים הגולמיים (ארגוני בריאות ציבור). הסיבה הברורה היא שסוג הנתונים שנאסף מאפשר, בהצלבות פשוטות, ולמרות ההמנעות מאיסוף פרטים מזהים, להביא לזיהויו של אדם שדיווח על עצמו או על בני משפחתו. ברור שמדובר בפשרה אל מול העקרונות שמנחים אותנו ברוב הפרוייקטים בסדנה, אך להבנתי - כמי שאכפת לו גם מפרטיות ולא רק ממידע ציבורי - נתוני הפרט בהקשרים רפואיים אינם מידע ציבורי והגנה עליו נדרשת בסיטואציה שכזו. האיזון אל מול הפשרה הזו ניתן בדמות פרסום והנגשת של התוצרים המתעדכנים (מודל הניבוי) ברמת הישוב והשכונה בזמן אמת לכל דורש/ת בפורמט קריא מכונה. בעיני יש לפרסום המידע הזה ערך רב גם במישור הציבורי וגם עבור הפרט.

הלצת הפתיחה שלך, מצמצת את מאמץ להציע בזמן אמת אמצעי אפקטיבי להתמודדות עם מצב חירום לאומי ל"סיפור אהבה בין דאטה לחוקר". זה ניסוח שמבטא חוסר היכרות עם הפרטים והנסיונות שנעשו ליעול וניצול המידע (חלקם מוצגים בלשונית “מדיה” באתר, חלקם בהצגת הכלי והניבויים בזמן אמת עם מקבלי החלטות). או, במקרה הפחות טוב, מבטא זלזול בעבודה ובכנות הכוונות של השותפים למהלך. אני מניח שזו לא הכוונה שלך, ולכן השבתי. אז בוא ננסה שוב, בתגובות או בשאלות ההמשך: שאל אותי בצורה עניינית את השאלות שמעניינות אותך לגבי הפרוייקט עצמו ואשיב ואשתף ככל שאוכל.

לייק 1

הצ’טבוט אכן שואל שאלות רפואיות, ואכן שואל שאלות שאפשר דרכן לזהות אנשים ספציפיים.

אני מסכים איתך שלפרסם את התשובות לכל השאלות, לא ניתן.

מה שהיה ניתן לעשות, הוא לפרסם את התשובות לחלק מהשאלות.

כדי לתת דוגמה, להלן השאלות שהצ’טבוט שאל אותי עכשיו. לרוב התשובות עניתי “לא” כדי לקצר את מספר השאלות:

  1. בן? בת?

  2. בן כמה?

  3. מה הוא מקום המגורים?

  4. שם הרחוב?

  5. כמה מבוגרים מעל לגיל 18 גרים בבית?

  6. וכמה ילדים מתחת לגיל 18?

  7. אשאל אותך על מחלות, שחשוב לנו לדעת אם אובחנו אצלך בעבר או שיש לך כיום:

    • סוכרת
    • בעיית יתר לחץ דם
    • מחלת לב
    • כלי דם או שבץ
    • מחלת ריאות כרונית כולל אסטמה (ללא אסטמה בילדות)
    • סרטן
    • אי ספיקת כליות
    • דיכוי חיסוני לרבות תרופות המדכאות את מערכת החיסון
  8. מה לגבי עישון?

    • עישון יומיומי
    • עישנתי בעבר, הפסקתי לפני פחות מחמש שנים
    • עישנתי בעבר, לפני יותר מחמש שנים
    • אף פעם
  9. האם אובחנת בעבר כחולה בקורונה בבדיקת PCR?

  10. האם היית היום בבידוד?

    • כן, בבית שלי ובנפרד מבני משפחתי
    • כן, בבית שלי
    • כן, במלון
    • אני לא בבידוד
  11. האם יש לך עבודה קבועה מחוץ לבית בימים אלה?

  12. וכמה שעות, פחות או יותר, עבדת שם בשבוע האחרון?

  13. האם העבודה במקום קבוע?

  14. אפשר לשאול איפה נמצא מקום העבודה?

  15. ובאיזה רחוב זה?

  16. האם באחד מן הימים בשבוע האחרון נתת שירות בעבודתך ליותר מ-10 אנשים?

  17. האם העבודה שלך היא כחלק מצוות רפואי - בטיפול בחולים או בקבלת קהל?

  18. האם ביקרת בבית תפילה באופן שגרתי השבוע?

  19. האם יצא לך להשתמש בתחבורה ציבורית בשבוע האחרון?

  20. האם חבשת השבוע מסיכה כשיצאת מהבית?

  21. ומה נשמע היום?

    • בסדר גמור
    • לא ככ"ך טוב
  22. אוייש… איך זה בא לידי ביטוי?

  • שיעולים או נזלת
  • קוצר נשימה
  • כאבים
  • שלשול
  • חוסר בתאבון או דילוג על ארוחות
  • בחילה או הקאות
  • צמרמורת
  • בלבול
  • עייפות או חולשה
  • איבדתי את חוש הטעם או הריח
  • פריחה על העור
  1. האם חשת בתסמינים אחרים בימים האחרונים? אם כן, מהם?
  2. האם נמדד חום היום?
  3. האם ביממה האחרונה שהית בקרבת אנשים (שאינם בני הבית) למשך יותר מ-15 דקות ובמרחק של פחות מ-2 מטרים

את התשובות לשאלות הבאות לדעתי היה ניתן לפרסם, מבלי לפגוע בפרטיות של המשיבים:
3. מה הוא מקום המגורים?
4. שם הרחוב?
21. ומה נשמע היום?
- בסדר גמור
- לא ככ"ך טוב
22. אוייש… איך זה בא לידי ביטוי?

  • שיעולים או נזלת
  • קוצר נשימה
  • כאבים
  • שלשול
  • חוסר בתאבון או דילוג על ארוחות
  • בחילה או הקאות
  • צמרמורת
  • בלבול
  • עייפות או חולשה
  • איבדתי את חוש הטעם או הריח
  • פריחה על העור

אולי במקרים ספציפיים כשהרחוב מכיל מעט בתים, אפשר לא לפרסם את שם הרחוב, או להחליף אותו בשם של רחוב ליד.

הלצת הפתיחה שלך, מצמצת את מאמץ להציע בזמן אמת אמצעי אפקטיבי להתמודדות עם מצב חירום לאומי ל"סיפור אהבה בין דאטה לחוקר"

הכוונה שלי היתה שזה יישמע כמו הפרסומות האלה לספרים ברדיו, אבל מתנצל שזה לא הובן ככה. אין לי חוש הומור מפותח, אז אני אמנע משימוש בו בהמשך השרשור. בכל מקרה מחקתי, וגם התנצלתי בפרטי.

כפי שהסברתי, החלטנו מראש לשים דגש על עידוד הדיווח והדיווחים החוזרים, להקפיד על נושא הפרטיות והאנונימיות והצענו תמורה ציבורית בדמות פרסום מתעדכן של תוצאות מודל הניבוי והנגשתן בצורה גראפית ברמת הישוב והשכונה
ברור שניתן היה לפרסם תשובות לחלק מהשאלות, אבל אני טוען זו היתה טעות, בהקשר של הפרוייקט הזה כי:

  • מידע רפואי ובריאותי של הפרט הוא לא מידע ציבורי- אין בו ערך של ממש לציבור לכשעצמו (למעט, אולי, במקרים של בעלי תפקידים או נבחרי ציבור, וגם על זה אפשר להתווכח).
  • גם אם היה ערך ציבורי במידע שנאסף ברמת הפרט בשאלון, מכיוון שפרסומו עלול לפגוע (בהקשרים מסויימים) במדווחים, חשוב יותר להגן על זכותם לפרטיות.
  • פרסום רשומות הדיווחים הגולמיים היה מצמצם כנראה את מספר הדיווחים ופוגע בהיענות היפה שהיתה לקריאה להעביר דיווחים יומיים. אני יכול להעיד על עצמי שלו ידעתי שהמידע האישי שאני חולק לצורך מוגדר בשעת חירום עשוי לשמש אחרים למטרות שאינן ידועות לי, לא רק שלא הייתי מדווח, אלא הייתי את הקרובים לא לא לשתף פעולה עם יוזמה שכזו.

תוכל לנסות לאתגר את ההנחות והשיקולים שהצגתי במענה על השאלות הבאות:

  1. מה הערך ציבורי שאתה רואה בפרסום הרשומה שכוללת דיווח שאדון/גב’ X מרחוב Y בעיר Z סבלו מסחרוחרת או כאב ראש ביום W? האם הוא שווה את הסכנה שבפגיעה בפרטיות המדווחים, שהסכמת שניתן יהיה, בהינתן מוטיבציה, לזהותם? אם כן, למה?
  2. לאור מטרות הפרוייקט, האם בעיניך נכון היה לפרסם מידע גולמי ברמת הרשומה גם במחיר של ירידת מספר הדיווחים? אם כן, למה?
  3. כתבת ש"אולי במקרים ספציפיים כשהרחוב מכיל מעט בתים, אפשר לא לפרסם את שם הרחוב, או להחליף אותו בשם של רחוב ליד", אלא שאין נתונים מסודרים לגב מספר הבתים בכל אחוב בישראל, ויתרה מכך, ויש לא מעט ישובים ללא שמות רחובות. איך היית מתמודד עם זה?

אין סיבה להמנע משימוש בהומור, בסה"כ לא הבנתי נכון את כוונתך. הסברת ותיקנת, הכל בסדר, תודה.

לייק 1

מסכים לגמרי. אבל המידע הוא אנונימי אז לדעתי לא אמורה להיות בעיה.
גם בוא לא נשכח שמדובר בדיווחים כמו “היום השתעלתי” ולא היסטוריה רפואית מלאה.

  • פרסום רשומות הדיווחים הגולמיים היה מצמצם כנראה את מספר הדיווחים ופוגע בהיענות היפה שהיתה לקריאה להעביר דיווחים יומיים. אני יכול להעיד על עצמי שלו ידעתי שהמידע האישי שאני חולק לצורך מוגדר בשעת חירום עשוי לשמש אחרים למטרות שאינן ידועות לי, לא רק שלא הייתי מדווח, אלא הייתי את הקרובים לא לא לשתף פעולה עם יוזמה שכזו.

קשה לומר. מצד שני:

  • היו מלא חוקרים שהוציאו שאלוני קורונה. אם כולם היו מרכזים מאמצים סביב שאלון אחד, פתוח, אולי היו יותר עונים עליו. אני אישית מכיר חוקרים שהיו מאוד מתוסכלים מהעניין.
  • בשאלון של מכון ויצמן יש 25 שאלות, לא כולל תתי-שאלות. להערכתי בקלות 40 שאלות. הרבה יותר קל לענות על שאלון עם 4 שאלות פשוטות מאשר 40 שאלות מסתעפות.

תוכל לנסות לאתגר את ההנחות והשיקולים שהצגתי במענה על השאלות הבאות:

  1. מה הערך ציבורי שאתה רואה בפרסום הרשומה שכוללת דיווח שאדון/גב’ X מרחוב Y בעיר Z סבלו מסחרוחרת או כאב ראש ביום W? האם הוא שווה את הסכנה שבפגיעה בפרטיות המדווחים, שהסכמת שניתן יהיה, בהינתן מוטיבציה, לזהותם? אם כן, למה?

לא רואה איך פרטיותם יכולה להיפגע אם התשובות לא כוללות פחות או יותר שום דבר חוץ מ"היום השתעלתי" ובלי דרך לשייך את זה אליהם אישית.

  1. לאור מטרות הפרוייקט, האם בעיניך נכון היה לפרסם מידע גולמי ברמת הרשומה גם במחיר של ירידת מספר הדיווחים? אם כן, למה?

כאמור, קשה לדעת מה היה קורה למספר הדיווחים, אבל יכול להיות ששאלון קצר (4 שאלות מול 40) ופתוח, שמאומץ ומקודם ע"י כל החוקרים בארץ, היה מקבל יותר דיווחים.

  1. כתבת ש"אולי במקרים ספציפיים כשהרחוב מכיל מעט בתים, אפשר לא לפרסם את שם הרחוב, או להחליף אותו בשם של רחוב ליד", אלא שאין נתונים מסודרים לגב מספר הבתים בכל אחוב בישראל, ויתרה מכך, ויש לא מעט ישובים ללא שמות רחובות. איך היית מתמודד עם זה?

לדוגמה, מחליף את זה במיקוד, או מחליף כל 10 רחובות קרובים ברחוב אחד מתוכם, או אם זה יישוב קטן פשוט לא מציין רחוב.

אין סיבה להמנע משימוש בהומור

את זה אתה אומר, אדם עם חוש הומור מפותח. אנשים כמוני צריכים להיזהר יותר, וגם ככה הסיכוי שאני אספר בדיחה מצחיקה הוא נמוך ביותר.

אגב, אני רואה עכשיו שאני לא הראשון שמעלה את העניין הזה. Moshe Yaniv כתב לנו בפורום:

הרי הסכמת בתשובה הקודמת שלך שלמרות שהמידע הוא אנונימי, ניתן בעזרת הצלבות ובהינתן מוטיבציה לאתר במקרים מסויימים את המדווח, אז יש כאן בעיה.שים לב ענית לשאלה הראשונה מהו הערך הציבורי בפרסום הרשומה ברמת הפרט.

לא שוכח. אני יכול לחשוב על דוגמאות לשימוש זדוני גם במידע שנראה לך מאוד טריוויאלי ומעדיף לא לעשות זאת בפרסום פומבי. אני טוען שבאופן עקרוני זה מידע פרטי, שאין לך זכות להפיץ מידע כזה, וגם שאין לך (או לי) את הזכות להכריע בשאלה איזה מידע רפואי הוא בטוח או לא בטוח להפצה עבור אחרים.

לטענה שלי ש"פרסום רשומות הדיווחים הגולמיים היה מצמצם כנראה את מספר הדיווחים ופוגע בהיענות היפה שהיתה לקריאה להעביר דיווחים יומיים" ענית:

תצטרך פה לסמוך עלי שלא כל כך קשה לומר: קיבלנו על כך שאלות ממשתמשים וחיווינו כולנו אוירה של חשדנות וחשש ממעקב אזרחי והשלכות אפשריות של הדיווח.

לא ענית לשאלה “האם בעיניך נכון לפרסם מידע גולמי ברמת הרשומה גם במחיר של ירידת מספר הדיווחים”, רק ציינת שקשה לדעת מה היה קורה. אלא שכמו שאתה מכיר חוקרים מתוסכלים, אני מכיר מדווחים חרדי פרטיות - האם נכון היה לוותר על הדיווחים שלהם ואם כן, מדוע?

ההערה הזו לא רלוונטית לדיון. הצוות של הפרוייקט לא שימש כקבינט הקורונה באותה תקופה :slight_smile:. וברצינות: הפרוייקט שאנחנו דנים בו לא נועד לספק תשתית מחקרית למחקר הלאומי המשותף הלא קיים שאתה מתאר. אנחנו בסך הכל שיתפנו פעולה עם גורם מחקרי, שאגב, הוביל לשיתוף בהמשך פעולה ושיתוף מידע עם גורמים מרכזיים אחרים (רשימת השותפים באתר).

אתה כנראה מניח שאפשר היה לארגן את כל החוקרים בארץ להסכים על שאלון בנוסח אחיד. אני בספק ובכל אופן, לא נתקלתי בנוסח שכזה. מצד שני, אם הנושא חשוב לך, זכור שקוד הפרוייקט יוכל לשמש כתשתית לשאלונים מחקריים עתידיים, במידה ויעלה צורך שכזה. מוזמן להפנות את החוקרים המתוסכלים ששוחחו איתך כדי שיכירו את הכלי וישקלו לעשות בו בשימוש במחקריהם.

לתשובתך: אין לי את הידע הנדרש באפידמולוגיה, אבל כנראה שהצוות המחקרי היה מוצא פחות ערך ויכולת ניבוי בשאלון של 4 שאלות. נוסח השאלון בפרוייקט שביצענו השתנה והתפתח לאורך הזמן (תוכל למצוא את הגרסאות השונות בגרסאות קובץ תסריט השימוש). למעשה, זה היה אחד הדברים היפים בעיני בפרוייקט הזה - הוא התאים את עצמו לבסיס הידע המתהווה בזמן אמת ולהשערות שהתפתחו לאורך הזמן.

מספר השאלות היה מצומצם יותר בתחילת הדרך, וגם לטעמי בשלבים המאוחרים של הפרוייקט מספר השאלות היה גבוה. כדי לנסות להקל על המילוי החוזר, הגדרנו חלק מהשאלות (אני מניח שהן כלולות ב-25 שאלות שספרת) כשאלות שלא יופיעו למדווחים בכל דיוח, אלא אחת לתקופה, או רק בדיווח הראשון. שוב, הדיון כאן הוסט משאלת פרסום הנתונים הגולמיים לאופן שבו אתה היית מעצב מחקר.

נתעלם לרגע מהעובדה שקובץ המיקוד לא פורסם בפורמט פתוח (הנה לך דוגמה למידע ציבורי אמיתי, שאינו נגיש לציבור). אגב זה, ממליץ לעקוב כאן אחרי העתרה שהגיש @zomerg בנושא. (אין מלים לתאר את הערכתי). בכל אופן גם אם ניתן היה לעשות זאת, המשמעות של ההצעה שלך היא לשנות את נתוני המקור ולפרסם נתונים מעובדים מבחינה גיאוגרפית.

ברור שאתה לא היחיד (היו נוספים ששוחחו איתי בנושא). יתכן שגם אני הייתי מעלה שאלות דומות לולא הכרתי את הפרטים, ולכן אני טורח להסביר ולספר, ואשמח גם ללמוד אם טעינו. אלא שבינתיים לא עלה כאן טיעון של ממש אל מול ההיבטים שהצגתי, וגם בציטוט שהבאת בקישור לא ראיתי התמודדות עם השיקולים הללו.

לייק 1

האם בעיניך נכון לפרסם מידע גולמי ברמת הרשומה גם במחיר של ירידת מספר הדיווחים?

זה תלוי מה הערך של המידע הגולמי ומה הירידה במספר הדיווחים. אין לי תשובה כללית.

אתה כנראה מניח שאפשר היה לארגן את כל החוקרים בארץ

מה שיפה בדאטה פתוח, זה שאנשים מתארגנים סביבו באופן טבעי. לא צריך לארגן אותם.
בפרויקט המפה של הקורונה אנחנו בכלל לא פרסמנו את זה שהדאטה פתוח, ועדיין מלא אנשים מצאו אותו והשתמשו בו. חוקרים, אנשי דאטה פרטיים, מוסדות, משרד הבריאות, משרד הביטחון. אני מנחש שהיו רבים שהשתמשו וגם לא סיפרו לנו. לדוגמה - יום אחד שיניתי את השם של הקובץ נתונים. תוך כמה שעות קיבלתי כמה פניות מאנשים שאני לא מכיר שהמערכות האוטומטיות שלהם נכשלו והם תהו מה קרה.

כנראה שהצוות המחקרי היה מוצא פחות ערך ויכולת ניבוי בשאלון של 4 שאלות

עדיין אפשר לשאול 40 שאלות, אבל לשחרר נתונים של 4 מתוכן.

המשמעות של ההצעה שלך היא לשנות את נתוני המקור ולפרסם נתונים מעובדים מבחינה גיאוגרפית

כן, בדיוק. זה נקרא אנונימיזציה של נתונים וזה תהליך מאוד מקובל.

אז בעצם, למה לא עשינו אנונימיזציה של הנתונים כך שנוכל לשחרר אותם?

אני הצעתי לשחרר רק 4 שאלות - על המיקום ועל התסמינים:
3. מה הוא מקום המגורים?
4. שם הרחוב?
21. ומה נשמע היום?
22. אוייש… איך זה בא לידי ביטוי?

אם שם הרחוב בעייתי - אפשר גם להוריד אותו.

מדובר במידע בסגנון “היום 100 אנשים השתעלו באשדוד”. באשדוד גרים מעל 200,000 איש. לא נראה לי שאפשר למצוא מי שם השתעל. כמובן שאפשר גם לנסות לחלק את אשדוד למקבצים של 1000 איש ואפשר לדון בזה, אבל בכל מקרה - אפילו שיחרור של תסמינים ברמת ערים לא היה.

רק רוצה לתקן (או להזכיר) ל-@noam -

  1. אחד השלבים הראשונים שביצענו היה לבצע אינטגרציה של המערכת עם ״הכספת״ של משרד הבריאות, שם המידע הגולמי מהשאלון של מכון ויצמן (ושאר השאלונים האחרים שהגיעו בשבועות אחרי כן) פתוח וזמין לכל הגורמים הרלונטיים - חוקרים באקדמיה ובמערכת הבריאות שיש להם את ההכשרה הרלוונטית לנתח את המידע ולהסיק ממנו מסקנות.

  2. מידע אגרגטיבי על בסיס יום ואיזור סטטיסטי (יותר מדויק מעיר) פורסם גם כן (קיים שם מידע עד ה-7 לאוקטובר) - הנה הלינק: https://github.com/hasadna/avid-covider-raw-data/blob/master/input/2020-10-07.csv.
    עם זאת, לדעתי למידע כזה היה ללא ספק פחות אימפקט מהמידע הגולמי שהגיע בדיוק לקהל היעד שיודע איך להשתמש בו.

בהערת אגב, אני חייב לומר שאנונימיזציה של מידע סטטיסטי או רפואי היא נושא די מורכב שלא מעט אנשים חושבים עליו. גם ניתוח תסמיני מחלה והבנה של המידע הנדרש בשביל לזהות התפרצויות הוא עסק לא פשוט. האנשים במכון ויצמן ובמשרד הבריאות שעבדנו איתם על הפרויקט מבינים יותר ממני וממך בתחומים האלו ובשלל אחרים. נכון שלפעמים נדמה לנו שאנחנו בטוחים לגבי הפתרון לבעיות האלו, אבל ביננו - קצת ענווה לא תזיק.

3 לייקים

השאלה לגבי הערך הציבורי נשאלה בהקשר של המידע שאספנו בפרוייקט הזה. האם בעיניך נכון לפרסם מידע גולמי ברמת הרשומה גם במחיר של ירידת מספר הדיווחים? בעיני לא.

נכון, ואני טוען שאם הדיווחים האלה היו מוגדרים כמידע פתוח האמון ואיסוף הנתונים היו נפגעים, ושבנוסף, לא נכון לאפשר לכל מי שרוצה לקבל דיווחים פרטיים על מידע רפואי בצורתם הגולמית. פירטתי את הטיעונים בתשובות הקודמות ולרובם לא התייחסת.

כפי שציין @aaa וכפי שציינתי גם אני מוקדם יותר, זה גם גרה עם הנתונים שנאספו על ידינו. משום מה אתה מדלג על הפרט הזה. נכון שהיתה בקרה בגישה לנתונים הגולמיים שאספנו, אך כאמור בעיני זו היתה חובתנו המקצועית.

ובעיני זו בעיה והתנהלות לא נכונה עם נתונים ודיווחים מהסוג שאנחנו החלטנו שנדרשים לאסוף לצורך קידום מטרת הפרוייקט.

לא מתייחס לזה שוב, לדעתי עניתי בתשובה הקודמת, במשפטים שדילגת עליהם בתשובתך.

עשינו כמיטב יכולתנו (מוזמן להסתכל בדוקמנטציה ובקוד) ועדיין, כפי שהסברתי (והסכמת), לא ברמה שיכולה להבטיח את פרטיותם של כל המדווחים. ההגנה על פרטיות המשתמשים ועמידה באמון שנתנו חשובה בעיני יותר מהשיקול שאפשר (טכנית) לתת גישה לנתונים הגולמיים לכל דורש/ת.

כפי שכתב אדם, ובקישור אליו הפניתי מוקדם יותר, מופיע פחות או יותר מה שאתה מתאר.


@aaa תודה על ההבהרות - תיארתי את שתי הנקודות שהוספת בתשובות קודמות, בצורה פחות ברורה ממך.

2 לייקים

היי אדם! שמח לראות גם אותך פה :slight_smile:

זה תלוי מהו המידע הגולמי, ומה מידת הירידה ברמת הדיווחים. אין לי תשובה כללית. עבור דיווח רשומות בסגנון של “כמה אנשים השתעלו היום באשדוד”, לא רואה סיבה שתהיה ירידה בדיווחים ולכן לא רואה סיבה לא לפרסם.

זה גם קרה עם הנתונים שנאספו על ידינו. משום מה אתה מדלג על הפרט הזה

הציבור לא יכל לגשת למידע גולמי שעבר אנונימיזציה, כי מידע כזה לא פורסם.

כפי שכתב אדם, ובקישור אליו הפניתי מוקדם יותר, מופיע פחות או יותר מה שאתה מתאר.

מדובר במידע המעובד ע"י חוקרי מכון ויצמן, לא המידע הגולמי של השאלונים שעבר אנונימיזציה.

לא הבנתי את התשובה לשאלה אז אני שואל שוב, בניסוח קצת שונה -
למה לא פרסמנו את התשובות ל- 2 השאלות הבאות?

  1. עיר מגורים (“מה הוא מקום המגורים?”)
  2. מהם התסמינים שלך? (“ומה נשמע היום?, אוייש… איך זה בא לידי ביטוי?”)

אין לי דעה מגובשת בכל הנושאים שעלו פה, אבל אני חושב שהתפיסה צריכה תמיד להיות: מפרסמים הכל חוץ ממה שיש סיבה טובה לא לפרסם, ככה אנחנו מתייחסים למידע גם כשאנחנו דורשים אותו מהרשויות. אם החוקרים של מכון וייצמן מוצאים ערך במידע הזה אולי גם חוקר בלתי תלוי אחר שיקבל את המידע ימצא בו ערך. ואז נשאלת השאלה איך מטשטשים את הקשר בין האדם למידע, וזה יש הרבה דרכים לעשות. כאמור לפי שכונות וכו׳.

לגבי השאלה השניה של האם זה שווה ירידה בכמות הדיווחים? זו שאלה טובה, אבל לא הייתי פוסל שגוף כמו הסדנא (בניגוד נניח למשרד הבריאות) יחליט שזה מחיר ראוי, שכן השקיפות היא בראש מעייניה של הסדנא. אני האחרון שמאמין בקונספירציות שרצות סביב הקורונה, אבל אני חושב שגם כמות דיווחים קטנה יותר היתה עוזרת להפריך/לאשר קונספירציות כאלה ואחרות, וזה חלק ממה שגוף שעוסק בשקיפות אמור לעשות.

דבר אחרון, זה טוב שדיון כזה מתקיים והיה נחמד גם אם הוא היה מתקיים תוך כדי שהדברים קרו ולא רק בדיעבד. נקודה למחשבה.

לייק 1

הי @Ofer_Bartal
אתה ממשיך להשתמש במונח “שחררנו את המידע”, למרות שהסברתי שאני לא יכול לקבל אותו בהקשר של דיווחים אישיים של נתונים רפואיים, שלא נופלים תחת שום הגדרה של “מידע ציבורי”. כפי שאדם ציין, הנתונים הגולמיים שאספנו הועברו לכלל הגורמים הרלוונטים לבריאות הציבור, בהתאם להתחייבות שלנו למדווחים.

כבר השבתי לשאלות האחרונות ששאלת בתשובות הקודמות שפרסמתי. נקלענו למעגל חוזר של טיעונים ולכן אני עוצר כאן. נראה יש בינינו אי הסכמה, וזה בסדר.

תודה על ההזדמנות להציג את השיקולים והדילמות בסוגיה ולנהל דיון על נושא מעניין.

2 לייקים

היי @noam,
תודה רבה על דיון מעניין :slight_smile:

החלפתי את המילה “שחרור” ב"פרסום", מקווה שזה בסדר ככה.

שוב תודה על כל התשובות וההשקעה בדיון. שמתי לך :heart: על כל הפוסטים :slight_smile:
גם לך אדם :wink: