۱۳۹۷ مهر ۱۸, چهارشنبه

همه دروغ می‌گویند؟

بهانه‌ی این یادداشت قسمت سوم پادکست بی‌پلاس است. اگر این قسمت را گوش نکرده‌اید یا با پادکست آشنایی ندارید بهتر است اول آن را از اینجا گوش کنید، هرچند سعی کرده‌ام در خود متن بخش‌های کلیدی پادکست را هم بیاورم. 
موضوع این قسمت بی‌پلاس کتاب همه‌ دروغ می‌گویند نوشته‌ی استفنس داویدووید (Stephens Davidowitz) است. کتابی درباره‌ی کلان‌داده‌ها. اطلاعات بسیار حجیمی که کارکرد روزانه‌ی ما در اینترنت در اختیار شبکه‌های اجتماعی و موتورهای جستجوگر می‌گذارد و بخش مهمی از فعالیت و درآمدهای این غول‌های فناوری در تحلیل و فروش آنهاست.
 نویسنده‌ی کتاب با دنیای کلان‌داده‌ها بیگانه نیست، او سال‌ها تحلیلگر کلان‌داده‌ها در شرکت گوگل بوده است (شاید بشود گفت داده‌پرداز). من اما با دنیای کلان‌داده‌ها بیگانه‌ی بیگانه‌ام. بیگانه‌ای که خود را یکی از مخاطبان عام کتاب می‌داند و به نظرش حق دارد در بپرسد: آیا واقعا همه دروغ می‌گویند؟ 
نویسنده بر چهار ویژگی مثبت کلان‌داده‌ها تاکید کرده است: 
  • دریایی از اطلاعات هستند که مدام زیادتر می‌شوند و برای جمع‌آوری آنها به نسبت سایر روش‌ها هزینه اندکی پرداخت می‌شود. 
  • دروغ‌نمی‌گویند. مردم ممکن است در نظرسنجی خود را بیش از چیزی که هستند منطبق با هنجارها نشان دهند اما هنگام جستجو در اینترنت اینگونه نیستند. 
  • هرچند کلان‌داده‌ها جوامع بزرگ و رفتارهای کلی را نمایندگی می‌کنند اما اگر خوب دسته‌بندی شده باشند می‌توان از طریق آنها دید بهتری هم نسبت به داده‌های محلی و خرد بدست آورد. 
  • یافتن همبستگی بین این داده‌ها و نتیجه‌گیریِ اگر A آنگاه B از این همبستگی، کم‌هزینه‌تر و سریع‌تر از روش‌های معمول است. 
کتاب پر است از مثال‌های این ویژگی‌های مثبت. از نشانه‌های ناشناخته‌ی سرطان لوزالمعده (مانند درد معده‌ی شبانه که با ربط دادن تاریخچه‌ی جستجوهای اینترنتی مردمی که این نشانه را داشته‌اند به جستجوهای بعدی‌شان در مورد سرطان می‌توان آن را ردگیری کرد) تا درستی‌سنجی اظهارات آمریکایی‌ها در نظرسنجی‌ها که ادعا می‌کردند سیاه‌پوست بودن اوباما برای آنها اهمیتی ندارد تا استفاده‌ی مشاوران رئیس‌جمهور آمریکا از یافته‌های کلان‌داده‌ها برای تنظیم یک سخنرانی ضدنژادپرستی موثرتر و مانند اینها. 
به چشم من اما (با وجود پذیرش اهمیت و جذابیت این ابزار تازه‌ بدست آمده) مثل خیلی وقت‌های دیگر ما با قبول حرف‌های کتاب، بی‌دلیل و عجولانه به کلان‌داده‌ها بیشتر از شایستگی‌شان اعتبار داده‌ایم. باور دارم اگر بر مبنای این اعتبار اجازه بدهیم کلان‌داده‌ها روایتگرِ بی‌رقیب جهان پیرامون‌مان باشند در برابر خطر فریبکاری‌های جدیدی آسیب‌پذیر خواهیم بود. به نظرم مهم است مدام به خودمان یادآوری کنیم افرادی مانند نویسنده‌ی کتاب، تحلیلگران بی‌طرفی نیستند. متخصصینی هستند که هرچه اهمیت کلان‌داده‌های بیشتر شود به تخصص آنها نیاز بیشتری وجود خواهد داشت و در نتیجه فرصت‌های مالی بزرگتری در اختیار آنها قرار خواهد گرفت. نظر آنها در مورد اهمیت تخصص‌شان، نظر یک کارشناس بی‌طرف نیست، نظر فروشنده‌ای‌ست در مورد کیفیت کالایی که می‌فروشد. 
با این نگاه مهم است که از نویسنده‌ در مورد درستی اسم کتابش سوال بپرسیم. او ادعا می‌کند اگر در شبکه‌های اجتماعی مثل فیس‌بوک کاربردهای واژه‌ی «شوهرم» را جستجو کنیم، واژه‌های پرکاربردِ پس از آن «بهترین دوست»، «بی‌نظیر» و «فوق‌العاده» هستند. در حالی که نتیجه‌ی جستجوی همین عبارت در بانک داده‌های گوگل، واژه‌های پرکاربرد «آشغال»، «اعصاب‌خردکن» و مانند اینهاست. پس نتیجه گرفته است که بیشتر آدم‌ها در مورد کیفیت روابط‌شان در فیس‌بوک دروغ گفته‌اند ولی وقت جستجو در گوگل با خیالِ راحت از بی‌نام و نشان بودن، حقیقت آشکار شده است. در نگاه اول ادعای نویسنده درست به نظر می‌آید. اما مردم برای چه کاری به سراغ گوگل می‌روند؟ کدام یک از این دو فردِ فرضی جمله‌ای در مورد شوهرشان را گوگل می‌کنند؟ کسی که ازدواج خوب و شادی دارد، یا کسی که در رابطه‌ای بد گرفتار شده و برای یافتن راه‌حل یا دستکم پیدا کردن آدم‌هایی با مشکل مشابه دست به دامن گوگل می‌شود.
از طرف دیگر در مواجه با استدلال‌هایی مانند استدلال‌های نویسنده‌ی کتاب باید پرسید: آیا هر همزمانی بین هر دو رویدادی به معنی رابطه‌ی علت و معلولی بین آنها است؟ کسی به طنز داده‌های مصرف پنیر در آمریکا و شمار فارغ‌التحصیلان رشته‌ی عمران در مقطع دکترا را در یک نمودار قرار داده بود و نتیجه‌گرفته بود که افزایش مصرف پنیر تعداد فارغ‌التحصیلان را افزایش می‌دهد. اگر بی‌ربطی این دو متغییر تا این حد آشکار و خنده‌دار نبود آیا کلان‌داده‌های مربوط به این آمار ما را فریب نمی‌دادند؟ 

به این نمونه توجه کنید: حمله‌ای تروریستی در آمریکا اتفاق می‌افتد. اوباما برای جلوگیری از ایجاد نفرت نژادی و مذهبی بیشتر در آمریکا در سخنرانی‌اش تلاش می‌کند مردم بیاد داشته باشند که چنین وقایعی نباید بتواند بین مسلمانان و دیگر گروه‌های جامعه‌ی آمریکا جدایی و نفرت ایجاد کند. بررسی کلان‌داده‌ها اما نشان می‌دهد درست همزمان با سخنرانی اوباما جستجوی عبارت‌هایی مانند «مسلمانان تروریستند» یا «مسلمانان را بکشید» در گوگل افزایش قابل‌توجهی داشته است. همچنین این افزایش هربار که اوباما به مسلمانان اشاره می‌کرده دیده می‌شده است، بجز چند استثنا. چندباری که او به مردم یادآوری کرده بود که از میان همین مسلمانان در جامعه پلیس‌هایی فداکار، ارتشیانی وظیفه‌شناس و ورزشکارانی هم به جامعه معرفی شده‌اند. در این زمان بود که در کنار عبارت‌های اسلام‌هراسانه‌ی بالا عبارت‌های «پلیس‌های مسلمان»، «ورزشکاران مسلمان» و مانند اینها هم به صدر جدول واژه‌های جستجو شده‌ی گوگل پیوسته بودند. طبق ادعای کتاب به نظر می‌رسد که نتایج حاصل از این تحقیق باعث شد که اوباما و مشاورانش در سخنرانی بعدی به جای پرداختن به کلیاتی در اهمیت همزیستی و مانند آن، روی عبارت‌هایی مثل پلیس‌های مسلمان تاکید کنند. به این ترتیب پژوهش یادشده کمک کرده است دید بهتری از جامعه بدست آید و با این دید بهتر، داروی مناسب‌تری برای دردهای جامعه پیدا شده است. 
اما آیا واقعا اینطور بوده؟ آیا پرتکرار بودن جستجوی عبارت «مسلمانان تروریستند» در گوگل به معنی اسلام‌ستیز بودن بیشتر آمریکایی‌هاست؟ فرض کسانی که به پرسش بالا پاسخ مثبت می‌دهند این است که بخش مهمی از آمریکایی‌ها در مورد مسلمانان گوگل می‌کنند و وقتی عبارت پرتکرار در این مجموعه اسلام‌ستیزانه باشد یعنی وزن این افراد بیشتر است. آیا این فرض درستی است؟ کسانی که به مذهب یا نژاد دیگران اهمیت نمی‌دهند چرا باید جستجوی خود را با عبارت «مسلمانان» آغاز کنند؟ وقتی اصالت را به کلمات بیشتر جستجو شده بدهیم، جامعه‌ی آماری ما کسانی هستند که افراد را بر اساس مذهبشان جدا می‌کنند. در میان این افراد عجیب نیست که نژادپرست‌ها صدای بلندتری داشته باشند. همین‌طور عجیب نیست که نژادپرست‌های منصف‌تر از شنیدن عبارت پلیس‌ها و ارتشیان مسلمان تعجب کنند و برای یافتن مصادیق آنها به سراغ گوگل بروند. برانگیختن کنجکاوی این افراد در مورد مسلمانان که شهروندانی عادی یا خوب و وظیفه‌شناس هم در میانشان هست البته اقدام موثر و خوبی است، اما تاکید بیش از حد روی وجود مسلمانان خوب در آمریکا بازی در زمین کسانی است که مردم را براساس مذهبشان دسته‌بندی و قضاوت می‌کنند. هیچ معلوم نیست پذیرفتن ضمنی این دسته‌بندی شرایط را بهتر کند که هیچ به احتمال زیاد به تعمیق شکاف‌ها نیز کمک خواهد کرد. 
به دلایل گفته شده شواهد انکارناپذیری را هم اضافه کنید که هر روز بیشتر در اختیار ما قرار می‌گیرند و نشان می‌دهند گروه‌هایی با صرف هزینه و انرژی قابل ملاحظه در مقیاس‌های جهانی و محلی در حال دستکاری تصویر مجازی جوامع مختلف‌اند. گروه‌هایی که ارتش‌های سایبری آشکار و مخفی دارند و با اهداف گوناگون در مقیاس بزرگی آدم‌های مجازی تقلبی می‌سازند و با استفاده از آنها کلیدواژه‌های پرکاربرد شبکه‌های اجتماعی و موتورهای جستجوگر را به میل خود تغییر می‌دهند.
 در پایان، نویسنده‌ای که اسم کتابش را «همه دروغ‌ می‌گویند» می‌گذارد تصمیم خودش را گرفته است. او حاضر است برای پرفروش شدن کتابش و رونق بازار کارش آینه‌ای سیاه‌ و کج‌نما پیش‌روی جامعه بگذارد. به نظرم اما بهتر است ما کمی محتاط‌تر باشیم و ادعاهایش را دستکم به راحتی قبول نکنیم.

هیچ نظری موجود نیست:

ارسال یک نظر