ניתוח: ניסוי בדיקת העובדות של טוויטר במקור המונים חושף בעיות

אָנָלִיזָה

ניתוח של Poynter מצא שפחות ממחצית ממשתמשי Birdwatch כוללים מקורות והערות רבות של בדיקת עובדות מכילות רטוריקה מפלגתית.

גרסה 14 בפברואר של אלגוריתם Birdwatch של טוויטר הגדילה כמה הערות עם מידע מטעה.

ב-5 בפברואר, טוויטר סומן פוסט של היוטיובר השנוי במחלוקת טים פול שאמר שהבחירות לנשיאות ארה'ב ב-2020 זויפו. הפלטפורמה ציינה כי התביעה שנויה במחלוקת וביטלה את ההתקשרות 'בשל סיכון לאלימות'.

אבל, הלאה צפייה בציפורים , של פלטפורמת המדיה החברתית ניסוי בבדיקת עובדות במיקור המונים , משתמשים ברובם המכריע אמרו שהציוץ אינו מטעה, על פי ניתוח 14 בפברואר של נתוני טוויטר. ורוב משתמשי Birdwatch ציינו בכלי שהם מצאו שההערות הללו שתמכו בטענות שהופרכו מועילות ואינפורמטיביות.

'לפי המקור המכהן של TIME הייתה קבוצה מאורגנת היטב של משתתפים חשאיים בארגון צללים שנשמע כמו קבורה שעבדה יחד כדי להטות את הבחירות לטובת ג'ו ביידן', נכתב באחת ההערות. בעוד שהמשתמש כולל קישור ל כתבה במגזין טיים שאכן משתמש במילים כמו 'קבאל' ו'קונספירציה', ההקשר של היצירה - שקבוצות חזקות פעלו מאחורי הקלעים כדי להגן על שלמות הבחירות - הולך לאיבוד.

ה אלגוריתם של שעון ציפורים , שמטרתה להציג הערות מועילות, הקצה כי 'לבדוק עובדות' ציון מועיל של 0.68 - הגבוה מבין ההערות בציוץ, ממש מחוץ ל-10% העליון של ההערות שנחשבות על ידי האלגוריתם 'מדורגות כמועילות' נכון לתאריך 14 בפברואר. הערות מועילות היוו כ-7% מתוך 2,695 בניתוח זה ופחות משני שלישים מהן מכילות קישור מקור שאינו עוד ציוץ.

ב-17 בפברואר, טוויטר שינה את האלגוריתם שלו והערות בציוץ של Pool כבר לא מדורגות כמועילות, למרות שהן עדיין מופיעים מתחת לפוסט . לפני השינוי הזה, היה סף נמוך יותר להיחשב מועיל - רק 0.5 בהשוואה לחתך החדש של 0.84 - והערות היו זקוקות רק לשלושה דירוגים כדי להיחשב מועילים, בתיעדוף לפי הסדר וסומנו בפתק כחול.

עכשיו פתק חייב לצבור חמישה דירוגים כדי לדחוף את הציוץ הזה לתוך כרטיסייה חדשה 'מדורג מועיל' בשעון ציפורים . ומתוך אותם כמעט 2,700 פתקים במסד הנתונים של הפלטפורמה, 126 עמדו ברף החדש - זה פחות מ-5%. שלושה רבעים מההערות החדשות 'מדורגות מועילות' הכילו מקור מחוץ לטוויטר.

זהו המחשה בזמן של אחת הבעיות העומדות בפני מודל שעוני הציפורים: האם אלגוריתם המוזן על ידי קבוצה אקראית לכאורה של אנשים אי פעם 'לדרג' במדויק את האמת?

שעון הציפורים, בשלב הפיילוט שלו עם קצת יותר מ-1,000 משתמשים, מאפשר למשתתפים לסמן ציוצים כמטעים ולהוסיף הערה המצטטת מקור ו/או מסבירה את ההקשר מדוע הוא עשוי להטעות. לאחר מכן, משתמשי Birdwatch יכולים לדרג הערות אלה על סמך מועילות (לאחר מכן, האלגוריתם משתלט).

בסופו של דבר, כל משתמשי טוויטר יוכלו לכאורה לראות את ההערות הללו ממש מתחת לציוצים, אך לעת עתה, הם מוגבלים ל חלק מסוים באתר . משתמשי שעוני ציפורים גם יבנו בסופו של דבר ציון מוניטין שיזין את אלגוריתם המועילות.

'המטרה שלנו עם הפיילוט של Birdwatch היא לבנות מערכת שבה כל אחד יכול לתרום, וזה באופן טבעי מעלה מידע שאנשים מוצאים מועיל', אמר סגן נשיא טוויטר למוצר קית' קולמן באימייל. 'אנחנו מאמינים שפתיחות במי שיכול לתרום היא חשובה, ושבאמצעות קלט מקבוצה מגוונת, ניתן להעלות את ההערות המועילות ביותר.'

אבל, מבט על המערכת כפי שהיא כעת מגלה אתגרים שבודקי עובדות העלו לגבי Birdwatch: חוסר מומחיות בבדיקת עובדות בקרב משתמשים, הקושי ליצור אלגוריתם שיעלה איכשהו את ההערות המועילות ביותר של המשתמשים המכובדים ביותר. שאלות על מניעים מפלגתיים של משתמשים.

'אני לא מופתע מהממצאים הללו בהתחשב באופי הקוטבי של פלטפורמות המדיה החברתית וההססנות של משתמשים מיינסטרים לספק משוב לפניות כאלה שמציעות פלטפורמות, בעוד שמשתמשים חדורי מוטיבציה משני צדי המעבר רואים בפלטפורמות זירות קרב לקידום הנרטיבים שלהם אחרים', אמר Baybars Örsek, מנהל הרשת הבינלאומית לבדיקת עובדות.

רוב ההערות של משתמשי שעוני הציפורים הפורה ביותר מסמנים ציוצים שמבקרים את הימין כ'מטעות' ואת אלה שמבקרים את השמאל כ'לא מטעים'. (לדוגמה, המשתמש סימן ציוץ שאומר ' צוות ביידן עדין כלפי סין ' מהסנאטור טד קרוז והפול מצייץ כ'לא מטעה'; בזמן כתבה של ניוזוויק על קיצוני ימין קיצוני ועל סאגת GameStop ו ציוץ קשירת הנשיא דונלד טראמפ למהומות הקפיטול סומנו כ'מטעות' ו'מזיקות'.) ופחות מחמישית מ-82 ההערות של המשתמש כוללות מקור, שכמה מהם ציוצים אחרים. (משתמש זה ב-Birdwatch לא הגיב לבקשה לראיון.)

קולמן אמר שניתן לתמרץ את שעון הציפורים לשקול הערות המגיעות מ'קבוצה מגוונת של תורמים'. יתרה מכך, מערכת הדירוג היא המניע העיקרי מאחורי הפלטפורמה

'אנו מאמינים שאלה יתגמלו ויתמרצו תרומות שאנשים רבים מוצאים בעלות ערך, ויתייחסו לסיכון של השתלטות של קבוצה או אידיאולוגיה ספציפית אחת על Birdwatch', אמר קולמן. 'זה משהו שנעבוד עליו באופן פעיל לאורך הפיילוט'.

ואכן, ההערות שהאלגוריתם דורג כמועילים ביותר בעקבות השינויים ב-17 בפברואר מציגים מקורות מוצקים יותר ורטוריקה פחות מפלגתית מאשר האיטרציה שבוצעה רק יום קודם לכן. אבל, שינוי אלגוריתם לתוכנית פיילוט עם 1,000 משתמשים ופחות מ-2,700 פתקים הוא דבר אחד, שינוי אלגוריתם ברגע ששעון ציפורים זמין לכל המשתמשים הוא דבר אחר - ומי יודע אם יעילות האלגוריתם תחזיק מעמד כשהמשתמשים יתחילו לשפוך לתוך הפלטפורמה, אולי משכפל את ההתנהגות של כמה ממשתתפי הטייס הפוריים ביותר.

'אין לנו כרגע ציר זמן ספציפי לשינוי קנה מידה, מכיוון שאנחנו עובדים כדי ללמוד כמה שיותר ולחזור בזמן שהפיילוט קטן', אמר קולמן. 'אנחנו מתכננים להגדיל את ההיקף כפי שאנו מסוגלים לעשות זאת בבטחה, ומתי זה יכול לעזור לשפר את הלמידה.'

ובכל זאת, כמו בהערות מתחת לציוץ של הבריכה, יש דוגמאות למפלגתיות אוֹ מידע מטעה עדיין גלוי כהערות רגילות.

לארבעה מתוך חמשת המשתמשים הפעילים ביותר, המהווים יותר מ-10% מההערות הכוללות, יש פעילות דומה למשתמש הפורה ביותר. אחד מהם טוען שמותו של ג'פרי אפשטיין מעולם לא נקבע כהתאבדות. עם זאת, הציפר השני הפורה ביותר מצטט מקור בכל הערה, כולל קישורים מארגון הבריאות העולמי ו FactCheck.org .

אף אחד מ-10 המשתמשים המובילים, לפי הביוגרפיה שלהם בטוויטר, אינו בודק עובדות מקצועי או עיתונאי.

'בדיקת עובדות היא למעשה עבודה קשה בכך שהיא תובענית נפשית', אמרה העורכת הראשית של PolitiFact, אנג'י הולן, באימייל. 'אתה באמת צריך להתרכז ולדחוף דרך אינרציה מנטלית כדי לזהות טענות ולאחר מכן לסעור מוחות באמצעים להפריך או לאמת אותן. לאחר מכן עליך לבצע חיפוש ולאחר מכן לכתוב את הממצאים. זה לא יום בחוף הים, בלשון המעטה. ואם לבודק עובדות יש מוטיבציה מפלגתית, זה מקשה עוד יותר על מאמץ יסודי ושווה'.

למרות הבעיות שלה, Birdwatch אכן מסמן מידע שגוי שבודקי עובדות מסורתיים עלולים להחמיץ או לבחור לא לבדוק בגלל פוטנציאל לנזק - מה שיכול לעזור למלא כמה פערים במידע שגוי דיגיטלי. במהלך סאגת game stop , מידע שגוי על מניות החברה התפשט במהירות על פני פלטפורמות.

סנופס ו PolitiFact לא דירג טענות לגבי GameStop, בעוד דירוג סיפורי לידים פוסט אחד של Reddit. אבל ב-Birdwatch, הפתק בעל הדירוג הגבוה ביותר - עם ציון מועילות של 1.00 - סימן ציוץ מטעה על Reddit, שם התנהלה שיחה על המניה. היו כ-50 הערות לגבי Reddit, GameStop ואפליקציית ההשקעות Robinhood, שבהן התרחש נפח מסחר גבוה בתחילת החודש.

ומשתמשי Birdwatch סימנו נכון חשבון הטוען שהוא שייך לסנאטורית וירג'יניה אמנדה צ'ייס כמזויף, לאחריו צייץ בטוויטר , '... יש לנו בעיית סמים בווירג'יניה, ולגליזציה של מריחואנה רק תוביל ליותר מנת יתר של מריחואנה ומוות...'

מיקור המונים יכול להקל על חייהם של בודקי עובדות מקצועיים על ידי זיהוי מידע מוטעה, אמר Örsek.

קולמן אמר כי טוויטר מחויבת לשמור על שקיפות - מה שאיפשר את הניתוח הזה - ולשלב מידע ממומחים על עתיד הפלטפורמה.

'מעבודה עם חבר צוות מוטבע מה- מרכז אוניברסיטת שיקגו ל-RISC , לאירוח מפגשי משוב עם כתבים וחוקרים, אנו פועלים לנצל את הכמות העצומה של המומחיות והידע שקיימים מעבר לטוויטר', אמר.

Holan ו- Örsek ממליצים על תמריצים והכשרה למשתמשי ב-Bedwatch, כמו גם על העסקת בודקי עובדות מקצועיים כדי לבדוק הערות בדרגים גבוהים.

'אבל אני די מטיל ספק בחברות טכנולוגיה שמאמינות שהמשתמשים שלהן ינהלו תוכן בחינם עבורם', אמר הולאן. 'רוב המשתמשים לא רואים את התפקיד שלהם לעזור לפלטפורמות לנהל את העסקים שלהם.'

גלה תאימות על ידי סימן גלגל המזלות

ניתוח: ניסוי בדיקת העובדות של טוויטר במקור המונים חושף בעיות

אָנָלִיזָה

ניתוח של Poynter מצא שפחות ממחצית ממשתמשי Birdwatch כוללים מקורות והערות רבות של בדיקת עובדות מכילות רטוריקה מפלגתית.