شماره 215: کتابِ حرف مفت می‌زنه!

The Art of Skepticism in a Data-Driven World
آبان 1399
قسمت دوم

شماره 215: کتابِ حرف مفت می‌زنه!

پادکست دکتر آذرخش مکری
شماره 215: کتابِ حرف مفت می‌زنه!
Loading
/

متن پادکست

سلام مجدد خدمت شما دوستان و علاقمندان عزیز. بخش دوم از بررسی کتاب calling bull shit رو دنبال می‌کنیم. به نظرم کتاب جالبیه و باز تأکید می‌کنم با وجود این‌که بعضی جاها خیلی چیزهای ابتدایی رو ارائه می‌ده که هرکسی دوره‌های پژوهش و روش تحقیق رو گذرونده باشه اون رو می‌دونه، ولی تأکیدی که بر این مباحث داره و همچنین مثال‌های جالب و شیرینی که ارائه می‌ده به‌نظر من کتاب رو خواندنی می‌کنه و بعضی‌ها می‌تونن بعضی قسمتاشو حالا با اغماض رد بشن از روش ولی اون لب کلامش چیزهای جالبی دربرداره. اگر خاطرتون باشه در قسمت قبل روی این تأکید کردم که نویسنده‌ها اصرار بر این دارند که ما به نوعی بیاییم و این مقوله حرف‌های بی‌سروته و قلنبه سلنبه‌ای رو که در زمینه‌های شبه علمی زده می‌شه نپذیریم و به جدیت در مقابل اون بایستیم. اما کل بحث این‌ها برنمی‌گرده به خرافات و مباحث ضدعلمی، بلکه گاهی و شاید به قسمت عمده‌ای از کتاب اشاره‌ای به این داره که خیلی از نویسنده‌ها میان مطالبی رو که درواقع به‌ظاهر علمی هستند ولی اون نتیجه‌گیری رو نمی‌شه ازشون کرد، به نقد می‌کشند و ادعاش بر اینه که ما که تعداد زیادی پژوهش‌های پایه داریم که این پژوهش‌های پایه‌ها به فرض اینه که درست باشن، روش تعقیب‌شون درست بوده باشه، نگارنده توش تقلب نکرده باشه که در بخشی هم بهش اشاره می‌کنه که می‌گه تقلب هم افزایش پیدا کرد و حالا دلیلش رو هم به بحث می‌ذاریم اما اون یافته‌ای که وجود داره توسط عده‌ای واسط یا عده‌ای که به خبرپراکنی، خبرنگاران علمی، ژورنالیزم علمی می‌پردازند یا حتی خبرگزاری‌ها نتایجی رو از اونا استنتاج می‌کنند که مدنظر پژوهشگر نبوده یا این‌که درواقع دست‌کاری‌شده دیدگاه اونه و اون رو در قالب مثال‌های جالب و بامزه‌ای ارائه می‌ده که من فکر می‌کنم که این مثال‌ها رو شما جاهای مختلفم می‌تونید پیدا کنید ولی مثال‌هاییش رو که به‌نظر من جالب نبودن و من به‌صورت خلاصه در آوردمشون خدمتتون ارائه می‌دم. پس ببینید بخش دیگری از این کتاب چالش ادعاهای علمی هست که پشتوانه درواقع قوی ندارند. به‌عنوان مثال اومده گفته مثلا پژوهشی اعلام کرده که هرچقدر قیمت مسکن می‌ره بالا میزان باروری انسان‌ها میاد پایین. مثلاً یک منطقه از آمریکا رو اومدن بررسی کردن و شما نگاه کنید شما یک هم‌بستگی منفی و معکوس می‌بینید دیگه. اون‌جا افزایش قیمت مسکن هست و این‌جا کاهش نرخ باروری هست که از یه نرخ باروری فرض کنید استاندارد اگر صفر درصد در نظر بگیریم هرچقدر مسکن گرون شده شما می‌بینید تعداد فرزندآوری کم‌تر شده. مثلاً این‌جا وقتی افزایش housing یا قیمت مسکن رسید به شصت درصد، شما شاهده کاهش ۲۰ درصدی نرخ باروری افراد بودین و میگه به کلی روی این برداشت کردن و یه عده خبرنگار اومدن گفتن که خونه داره گرون میشه و مردم دارن بچه کمتر میارن. دارم اینا رو به عنوان تمرین ذهن میگم اما نگاه کنید این اولاً هیچ چیزی رو ثابت نمی‌کنه. ادعای اون فرد که هر چقدر مسکن گرون بشه، مردم بچه کمتر میارن قابل اثبات نیست. اونچه که شما اینجا می‌بینید، فقط یک همبستگی آماریه. می‌تونه دلایل دیگه داشته باشه یا حتی می‌تونه برعکس باشه؛ مثلاً اشاره می‌کنه که خانواده‌هایی که فرزند کمتری دارند یا بچه کمتر میارن شاید اصلا متمول‌ترند و دوست دارند توی این ملک و مسکن سرمایه‌گذاری کنند. در نتیجه اون خانواده‌ها به محله‌هایی میرن که گرونتره و پول و سرمایه‌هاشون رو می‌برند سرمایه‌گذاری می‌کنند در اون محله‌ها و این باعث افزایش قیمت مسکن میشه یا اصلا ممکنه عنصر سومی باشه. شما با یک طبقه نوظهور مواجهید که دوست دارند پول زیادی در خانه بذارند و به دلیل اینکه این‌ها تکنوکرات‌اند و تحصیل کرده‌های بالا هستند و شاغل هستند، فرزند کمتری دارند و در نتیجه و آنچه که اینجا می‌بینید صرفاً یک همبستگی آماری است و شما نمی‌توانی از روی این نتیجه بگیری که خونه که گرون بشه مردم کمتر بچه میارن. یا بخش‌هایی از کتاب اختصاص پیدا کرده که ازاین مدل همبستگی‌ها ما به وفور می‌تونیم پیدا کنیم. بعضی‌هاش جنبه طنز داره مثلاً نگاه کنید نوشته در سال‌های ۱۹۹۹ تا ۲۰۰۷ ببینید این منحنی‌ها چقدر شبیه هم حرکت کرده، در واقع این منحنی روشن‌تر تعداد موارد قتل توسط اشیا داغ و برنده است مثلاً آب جوش، گاز آتشزا، آتش زدن و اینا و این سن میانگین افرادی است که به عنوان miss America برنده شدن و شما می‌بینید و می‌تونید نتیجه بگیرید که بین سن miss America و کشته شدن توسط بخار داغ و اشیای داغ یک همبستگی وجود داره. در صورتی که صرفاً می‌تونه یک جعل آماری باشه ولی ببینید این آمار رو جعل نکردند. من اصلاح کنم به گونه‌ای انتخابش کردندکه این گونه به نظر بیاد و وقتی شما ادامه این منحنی را تماشا می‌کنید و می‌بینید این کاملاً برملا میشه که این تصادفی‌ست. یعنی این قطعه رو در اسلاید قبل دیدید و ببینید چقدر خوب با هم ادامه دادند و اینجا همون قطعه است ولی اومدن از سال ۲۰۰۸ تا ۲۰۱۵ ادامه دادن و می‌بینید کاملاً به هم می‌خوره. پس میگه در واقع می‌تونیم گزینشی، یافته‌های علمی را منتشر کنیم و خیلی از این چیزهایی که شما در شبکه‌های مجازی می‌بینید، در اخبار می‌بینید، نمی‌دونم در تاثیر خوراکی‌ها می‌بینید، تاثیر بعضی از رفتارها به بیماری‌ها، بروز بعضی از پدیده‌ها و ارتباط اون با مثلاً گوشی تلفن و اینا، خیلیاش می‌تونه به صورت گزینشی انتخاب شده باشه. باز شما نگاه کنید؛ مورد دیگه میگه مرگ بر اثر مصرف داروهای ضد انعقاد و میزان دکتراهای جامعه‌شناسی در آمریکا از سال ۱۹۹۹ تا ۲۰۱۰. ببینید چقدر منحنی شبیه همه و وقتی شما نگاه می‌کنی و این حس رو داری خوب چه همبستگی‌ها و چه مرگ و میر بر اثر مصرف داروهای ضد انعقاد و و اونایی که phd گرفتن توی رشته جامعه‌شناسی وجود داره. و نگاه کنید اشاره‌ای که می‌کنه اینه که شما علاوه بر اینکه باید شک کنید به همچین آمارهایی، باید ببینید این آمار تقلبی نیست، این آمار رو گزینشی به شما دادند. مثلاً نگاه کنید یکی از این کلک‌هایی که زدن اینه که اومدن کف رو ۵۰۰ گرفتن، ۵۰۰ نفر و بعد اینجا صفر گرفتن، پس این منحنی‌ها خیلی به هم شبیه شدن. حتی یه دونه دیگه که نشون داده این دیگه خیلی طنزه چون می‌دونید توی فرهنگ خارجی‌ها وقتی بچه‌ها می‌پرسند بچه از کجا میاد، میگن اینو لک لک آورده. حاجی لک‌لک اینو گذاشته توی یه دستمال و آورده و این نشون داده میزان ‌زاد و ولد در کشورهای غربی Newborn bebies این چه همبستگی دقیقی داره با تعداد موارد لک‌لک‌ها! واقعا خوب میگه از این فرضیه ثابت میشه که لک لک‌ها هستند که بچه ها رو میارن و هرچه لک لک کمتر شده بچه هم کمتر شده و میگه شما می‌تونید اینجور آمارهایی رو جعل کنید. پس یه بحثی که داره میگه اینه هر جا شما یه گراف دیدید، یه منحنی دیدید، به خصوص تو این خبرگزاری‌ها، شبکه‌های اجتماعی، مثلا افزایش موارد مرگ و میر بر اثر فلان بیماری و در کنارش مثلاً مصرف تربچه در جای دیگه، میگی دیدی واقعاً این دو منحنی روی هم منطبق‌اند و از منبع معتبری هم استخراج شدن، مثلا از ژورنال لنست این آمار اومده ولی شما باید اینجوری فکر کنید که این اخبار گزینشی به شما داده شده. پس یه تمرین که شما باید انجام بدین اینه که حواستون باشه منحنی‌ها رو یا میشه گزینشی خدمت شما ارائه داد یا اینکه منحنی را جوری رسم کرد که شما فریب بخورید و در واقع میگه تمرین کنید که در رسم این منحنی ها حواستون باشه. و در بین این بحث‌ها یه قانون قشنگی رو ارائه داد که حیفم اومد بهش اشاره نکنم به نام قانون قانون گودهارد یا .Godhard s law این قانون چیزه قشنگیه واقعاً و میگه when a measure becomes a target it ceases to be a good measure ، میگه وقتی یک مقیاس اندازه‌گیری خود هدف می‌شود، دیگر مقیاس خوبی نیست. به این میگن قانون گودهارد. اگر شما این فایل رو دارید گوش می‌دید من ازتون یه خواهش دارم این قانون گود هارد رو به ذهن داشته باشید برای اینکه این قانون گودهارد خیلی از چیزا رو بدبخت کرده! معنیش چیه؟ میگه when a measure becomes a target وقتی یه مقیاس هدف میشه، مثلاً شما در نظر بگیرید هدف مدرسه چیه؟ آموزش کودکان. این یک هدفه. آموزش دانش آموزان برای آماده شدن برای رفتن به مدارج بالاتر و هدف مدرسه اینه ولی یکی از شاخص‌هایی که یه مدرسه خوب عمل می‌کنه میشه قبولی‌های کنکور یا تعداد المپیادی‌های اون مدرسه. چون فرض بر اینه که اون مدرسه‌ای که بهتر درس میده لابد از توش کنکوری‌های رتبه برتر پیدا میشه، تعداد المپیادی‌ها زیاد می‌شه و تعداد جایزه‌ها زیاد می‌شه. خوب پس این میشه یه مقیاس. قانون گودهارد میگه که اگه یک سیستمی اومد اون مقیاس‌ها رو هدف کرد، گند می‌زنه به اون مقیاس‌ها و بعد از یه مدتی شما شاهد مقیاس‌هایی خواهید بود که کاملاً ضد خودشان عمل می کنند. یعنی اون مدرسه دیگه به یادگیری و رشد کودک که سابقاً از راه قبولی در دانشگاه اندازه‌گیری می‌شد نمی‌پردازه. هدفش این میشه که رتبه کنکور خوب بیاد و اون موقع هدف گذاریش این میشه که ۵۰ نفر بیاریم که رتبه‌شون زیر۵۰۰ بشه و بعد از اون شما شاهد این هستید که رتبه کنکور ارزش خودشو از دست میده چون اینا با لطایف الحیل، انواع کلک‌ها، انواع روش‌ها سعی می‌کنند اون مقیاس رو بهبود ببخشند. شما این رو در بقیه حوزه‌ها می‌بینید. مثلاً ارزیابی بیمارستان‌ها، ارزیابی دانشگاه‌ها و مثال‌هایی زده که حتی از دانشگاه‌های خوب آمریکاست که میگه یکی از مقیاس‌های ارزیابی دانشگاه اینه که کلاس‌ها چند نفریه. میانگین کلاس‌ها چند نفر هستند. خوب این در واقع یک شاخص است، یک مقیاس است که خوب بودن دانشگاه رو مشخص می‌کرد ولی بعد از یه مدتی دانشگاه هدفش این میشه که تو این شاخص نمره خوب بیارن این میشه قانون گودهارد و بعد اینجوری میشه؛ خب شما شما می‌تونید تعدادی دروس فرعی درست کنید، ببینید حقه بازی اینطوری میشه، یه تعداد دروس فرعی درست کنید و ۱۰ نفر آدم بذارین توش یه استادم استخدام کنید و بعد اینا که میره توی آمار، میانگین کلاس میاد پایین و بعد درنتیجه شما دانشگاه خوبی میشید. یعنی به نوعی رنکینگت میره بالا و به نوعی اینو در مسئله ایران در نظر بگیرید. من قانون گودهاردو اینجا می‌خوام بگم که دوستان عزیز، قانون گودهارد می‌تونه به آینده علمی ما ضربه بزنه. یعنی اول می‌گفتند که هدف دانشگاه توسعه علمه ولی بعد از یه مدت گفتن نه این توسعه رو از کجا می‌فهمیم؟ از روی مقاله‌ای که چاپ میشه. بعد از یه مدت اون مقاله میشه هدف دانشگاه و بعد من الان فکر کنم بعضی از شما موافقید که این مقیاس لوث شده چون شما با ceases to be a good measure یا لطایف الحیل می‌تونید تعداد مقالاتو ببری بالا. نمی‌دونم یه پژوهشو ۱۰ تیکش کنی و در ده جاهای مختلف از همدیگه هی اسم ببرید. اسم یه نویسنده رو تو ده جا بذاری که در واقع اون ISI و scopes و اینا بره بالا و قانون گودهارد اینو میگه، وقتی سیستم ها میان اون مقیاس رو اولویت خودشون قرار میدن، در زمان بسیار کوتاهی اون مقیاس دیگه به درد نمی‌خوره و لوث میشه. و فکر میکنم شما هم با من موافقید که دیگه قبولی کنکور و تعداد مقالات چاپ شده و استنادهای علمی چندان معیار معتبری نیست و شما میگید که اولش جالب بود، اولش به نظر می‌رسید مدارس خوب این معیارو داشتن ولی الان داره به ضد خودش تبدیل میشه و توش کلی کلک و ظرافت ها و ریزه کاری ها با خلاقیت بشر شکل میگیره، که در واقع اونها رو دامن میزنه. حالا مثال هایی زده، مثلا میگه بعضی ژورنال ها میان توی ژانویه بیشتر مقالاتشون رو بیشتر میکنند. چرا؟ چون توی اول سال فرصت میکنه که بیشتر بهش استناد بشه و بعد اون ژورنال اثر بخشیش میره بالا و بعد بقیه میگن که این ژورنال چقدر ارتقا پیدا کرده. در صورتی که ژورنال ارتقا پیدا نکرده بلکه با ظرافت هایی مثل این که مقالات ژانویه رو زیاد کنم، مقالات مثلا دسامبر رو کم بکنم که در واقع این روند استناد به اون در یک سال تغییر بکنه، من به طور کاذب میتونم موفقیت پیدا بکنم. منتها هشداری که نویسنده های کتاب میدن اینه که چنین چیزی توی علم داره شیوع پیدا میکنه و شما شاهد تعداد زیادی از جعلیات و موارد ساختگی هستید. اشاره قشنگ دیگه‌ای می‌کنه، پس اون اصلاح گودهارد رو یاد بگیرید، یه اصطلاح دیگه داره که میگه .Zombie statistics میگه زامبی استاتیسیکس داره زیاد میشه. زامبی که خوب می‌دونید یعنی چی استاتیسیکس هم یعنی آمار و به طنز نوشته ۷۸.۴درصد آماری که ارائه می‌شود ساختگی است. خوب خود این گزاره هم ساختگیه. راست میگه. شما شاهد این هستید که مکرر توی سخنرانی‌ها، کتاب‌ها، یه آمارایی استناد میشه ولی اون آمار زامبیه یعنی توخالیه. مثلاً فرض کنید ممکنه که بگن که نمی‌دونم شاخص فرض کنید که توفیق تحصیلی از ۲۰ درصد رسیده به ۳۰ درصد و همه میگن اوه پس داری بهتر میشه ولی بعد یکی سوال می‌کنه توفیق تحصیلی یعنی چی. بعد تو کیا و چه جوری اندازه‌گیری میشه و توسط کی ارزیابی شده؟ و میگه ذهن انسان معمولا به این عمق نمیره و فقط یه عددو می‌شنوه. راستشو بخواین جسارتاً می‌گم قصد توهین به کسیو ندارم ولی من خیلی تو مطبوعات و اینا دیدم و توی این شبکه‌ها دیدم و شما آمارهایی می‌بینید ولی میگن هر موقع آمار دیدین یه ذره روش فکر کن که این آمارها تو کجاها اندازه‌گیری شده، با چه ابزاری اندازه‌گیریش کردن، یعنی مثلاً همین جمله رو دقت کنید۷۸ درصدی که آمار ارائه می‌شود ساختگی است. ساختگی بودنش رو از کجا فهمیدید؟ توی چی داره میگه؟ توی مطبوعات داره میگه؟ توی رسانه‌ها داره؟ میگه توی شبکه‌های اجتماعی داره میگه؟ و چه کسی با چه ابزاری اونو اندازه‌گیری کرده؟ ولی جالبه همین گزاره می‌تونه تیتر خبر خیلی از شبکه‌ها و مطبوعات باشه و شما می‌بینید خبرنگاران هم اینو مرتب استناد می‌کنند. توی مناظره و اینجور چیزها پس یه اصطلاحی که میگه توی سال‌های اخیر مد شده اینه که انسان‌ها مسلح شدن به آمار. راست میگه توی مصاحبه‌ها گهگاهی مسئول سیستمی چیزی رو که می‌بینید و می‌بینید میاد عدد می‌پرونه ولی وقتی شما می‌کنید نگاه می‌کنید که اون عدد یک زامبیه و ارزش زیادی نداره یا مثال دیگه‌ای می‌زنه چگونه انتخاب کردن نمونه، جواب رو کاملاً می‌تونه تغییر بده. یعنی شما از کجا میای نمونه گیری می‌کنی؟ که سمپل کجاست؟ مثلاً شما بیا این جمله رو تو گوگل سرچ کنی، جالبه میگه is my husband شوهر من هست… می‌تونید ببینید که گوگل خودش یه حالت اتوفیل داره، خودش پیشنهاد میده و از سوال‌های خیلی شایعی که قبلا پرسیده شده به شما پیشنهاد میده. میگه معمولاً همچین جمله‌هایی شاید بیادید. : شوهر من خیلی بدجنسه، شوهر من معتاد به پورنوگرافیه، شوهر من افسرده است، شوهر من خودخواهه. معمولا یکی دو تا صفت مثبت میاد. پس چه نتیجه می‌گیریم؟ نتیجه‌گیری می‌کنیم که وقتی خانم‌ها تو گوگل در مورد شوهراشون سرچ می‌کنند احتمالاً از دست شوهر خیلی عاصین، خیلی شاکین و پیشنهادهایی که قبل از اون مورد توجه قرار گرفته و رنکینگش اومده بالا توی این سیستم معمولا چیزهای منفیه. مثلا وقتی یکی سوال داره در مورد شوهرش، خیلی سریع براش میاد که شوهر من خشنه، شوهر من به پورن معتاده، در صورتی که همینو بیای در فیسبوک سرچ کنی یا توی این شبکه‌های اجتماعی سرچ کنی میشه my husband is my best friend ، my husband is my life، شوهر من همه چیه، شوهر من عشق منه، شوهر من نمی‌دونم بهترینه، شوهر من بهترین دوست زندگی منه، شوهر من تمام زندگیمه. خوب این نشون میده اونایی که توی شبکه‌های اجتماعی بودن به خصوص تو فیسبوک بودن اینو در فیسبوک استخراج کردن. در واقع همیشه سعی دارند یک نماد مثبتی از شوهر ارائه بدن. افرادی هستند که زندگی رو همینطور به قول خارجی‌ها رزی ببینند؛ زندگی براشون خیلی قرمز و صورتی و خوشاینده. در واقع در صورتی که اونایی که تو گوگل سرچ می‌کنند این جواب منفی رو داره پس در واقع چیزی که داره میگه اینه که شما نمی‌تونید بر اساس یک جمعیت خاص نتیجه‌گیری کنید و همونطور که گفتم خیلیا اینو می‌دونیم تو روش آمار، اما چون مثال‌هاش قشنگ بود گفتم که بگمش. یعنی شما شاید بری توی شبکه اجتماعی سرچ کنید معمولا اینا میاد. چرا؟ چون تو شبکه‌های اجتماعی همه سعی دارند زندگی رو خیلی خوب نشون بدن و بگن زندگی ما ایده آله و به همین دلیل بهترین جملاتی که در توصیف همسرشون، زندگیشون استفاده می‌کنند اینا هستند. جملات حالا توی رنکینگ میاد بالا که شوهر من زندگی من، شوهر من بهترینه، در صورتی که در زندگی دیگر سعی ندارند تصویر خوبی از همسرشون رسم کنند جواب‌هایی که میاد مثل همونایی هست که در اسلاید ۲۱ اومده. یا یک مسئله قشنگی داره که اجازه بدید من خیلی که توی متنش نرم به نظرم جالب بود و خیلی تامل برانگیزه و می‌ترسم اینجا بد ارائه بدم چون وقتمون کوتاهه و در واقع داستان شبیه اون قانون مورفی میشه. مورفی می‌دونین چی میگه؟ میگه وقتی شما توی اتوبان میرید تو یکی از دو تا خط معمولا اون خطی که تو رفتی این خط کند روئه و همیشه حرصت می‌گیره عجب بدشانسم! توی اتوبان تو هر خطی بریم اون خط کندتر میره جلو یا مثلاً توی پمپ بنزین یا جای دیگه و مثال شبیه این اینه که شما توی فرودگاه هستید و من می‌تونم مثال فرودگاه رو به ایستگاه اتوبوس در ایران تغییر بدم. وقتی شما توی ایستگاه اتوبوس هستید هر اتوبوسی که میاد بیشتر در اون طرف متمایله. اون طرف که نمی‌خوای سوار بشی. اونی که تو منتظرشی کمتر از بقیه میاد. توی فرودگاهم اینجوریه میگه مثلاً اگه هتل شما سرویس داره هرچی صبر کنید می‌بینید بیشتر سرویس اون یکی هتل میاد، هرتز میاد مثلاً و این نه بدشانسیه نه خطای ذهنه بلکه یه مقوله آماری هست و مقوله آماری اینو میگه که اگر این‌ها به صورت مساوی اتوبوس داشته باشند و اینا رو به صورت تصادفی پخش کرده باشی در واقع اونایی که از جناح رقیب، از خط انتقال رقیب شما می‌بینید به طور متوسط دو برابر اونیه که در خط خودت می‌بینی. خوب دلیلم داره برای اینکه اونایی که مال خط خودتن سوار میشید میرید و سمپل شما حذف میشه. پس شما در نظر بگیرید وقتی سمپل، یعنی نمونه، یه بخشیش حذف میشه همبستگی‌ها کامل به هم می‌ریزه و اینجا اشاره داره که خیلی از موارد که قضاوت‌های ما بر اساس سمپل یا نمونه‌های سوگیری شده است و میگه خیلی از یافته‌های علمی زیر سوال و شبهه هست به این دلیل که این یافته‌ها از حجم نمونه‌هایی استفاده کردند که بیان واقعیت جهان بیرون نیست بلکه سوگیری شده. بخشی از اون نمونه حذف شده و مثال‌هایی می‌زنه که چگونه این قضیه میتواند در نتایج آماری ما تاثیر داشته باشد. مثال قبلیشو دیدید اگر شما برید در گوگل نظرسنجی کنید می‌بینی حس می‌کنی که همه مردم از زندگی زناشوییشون ناراضین در صورتی که اگر بری شبکه اجتماعی مثل فیسبوک سرچ کنید می‌بینی همه آدما به نظر میاد که راضین یا لااقل دارن اینجوری نشون میدن. این مثال قشنگ دیگه‌ای زده. من این مثالو در خطاهای شناختی ارائه دادم ولی اگه اجازه میدید یه دو سه دقیقه‌ای هم اینجا مطرحش کنم. این میگه فکر کن از مردم بپرسید، اینو یک توضیح طبیعی جامعه در نظر بگیرید، یه مقدار مسائل رمانتیک یا عشقی دخیله و میپرسه که آیا اون انسان‌هایی که از جنس مخالف می‌بینی، راسته که میگن اونایی که خیلی هاتن، آدمای خیلی بد اخلاقین و اونا که خیلی نایسن یا آدمای دوست داشتنی و خیلی همچین مهربونن، قیافه ندارند؟ یعنی داستان اینه که آیا واقعاً راست میگن که آدمایی که گیره آدم می‌افتن یا خیلی خوشتیپ و خوش قواره و خوش قیافه هستن ولی اخلاق ندارن یا خیلی خوش اخلاقن ولی خوشتیپ نیستن و بین این دو تا یه رابطه معکوس است و میگه میشه آیا این را بررسی کرد یا نه. مثال قشنگی می‌زنه میگه فکر کن توزیع جامعه به این شکل باشه که این طرف شما محور هات بودن رو داری؛ اونایی که خیلی شیکن، خیلی جذابن و خیلی ظاهر زیبایی دارند و اونایی که از اینجا از اخلاق بد شروع میشه و تا اخلاق خیلی خوب میرن. ببین اینجوری شما نگاه کنید هیچ همبستگی وجود نداره و میگه شما معمولاً در نظر بگیر معمولاً شما اگر شروع می‌کنی برای یافتن شریک عاطفی عشقی رمانتیک، یه عده رو حذف می‌کنی و میگه خب ما تعارف نداریم دیگه یه عده‌ای که اون پایین هستند نه قیافه داره نه اخلاق داره شما اصلاً هیچ وقت باهاش معاشرت نمی‌کنی. حاضر نیستی باهاش یه قهوه خونه بری، یه کافه تریا بری، یعنی اون گروه رو نمیخوای. از اون طرفم یه عده‌ای هستند که میگه باز تعارف نداریم هر کسی دوست داشته باشی بعضیا انقدر استانداردشون بالاست که اونا شما رو نمی‌پذیرن و نمیخوان با شما معاشرت کنند و با شما با به date بیان و با شما قهوه خونه بیان، کافه تریا بیان در نتیجه این حد وسط می مونه. و شما وقتی این حد وسط رو نگاه می‌کنی یه ضریب همبستگی کاملا منفی، منفی۷۵ صدم پیدا می‌کنی بین هات بودن اون‌ها و بین همچین جذاب بودن اون‌ها و نایس بودنشون و خوب بودنشون. یعنی میگی والا ما هرکی می‌بینیم یا ظاهرش خوبه یا اخلاقش مثل اینکه این دوتا با هم جمع نمی‌شه. یعنی اونی که اخلاقش خوبه ظاهرش گنده و اونی که اخلاق بدی داره ظاهر خوبی داره. و درستم میگه و شما ببینید شما یک ضریب منفی ۷۵ صدم خواهید داشت در صورتی که این به روانشناسی انسان‌ها برنمی‌گرده این به حجم نمونه شما برمی‌گرده. شمایی که یه عده رو قیچی کردی انداختی دور و یه عده‌ای که شما رو قیچی کردن انداختن دور. با شما حاضر نیستن معاشرت کنند. در نتیجه شما این حالت را خواهید دید. در واقع این یک تراژدی که شما کجا وایسادی و من قبلاً راجع به اینم صحبت کردم که شناخت ما، باورهای ما، گرایش‌های ما، بیش از اون که پدیده ذاتی باشه، اینه که شما کجا وایستادی شما وقتی که طبقه متوسط هستی و فکر کن اون طبقه خیلی مرفه حذف کنی، و طبقه خیلی محروم رو هم از معاشرین خودت خط بزنی شما در بسیاری از صفت‌ها یک ضریب همبستگی منفی خواهید دید. در صورتی که این ضریب همبستگی ذاتی نیست کاملاً ساختگیه. مثلا شما امکان داره بگی که والا ما هرچی آدم دیدیم که هرچی پولدارتر بودن خسیس تر هم بودن. هرچی آدم دست و دلباز دیدیم فقیر بودن. یا هرچی آدم تحصیل کرده دیدیم فقیر بودن. هرچه آدم بی‌سواد دیدیم پولدار بودن و اینکه شما این همبستگی‌های منفیو در زندگیت می‌بینی و تعجب می‌کنی که چرا جهان این گونه هست و حواست باشه شاید حجم نمونه شما بیانگر کل جامعه نیست و اونایی که هر دو رو ندارن یا هر دو رو دارند توسط شما حذف شدند. خوب و اینم مثال‌های قشنگی که زده بود. و باز مسئله دیگه‌ای که مطرح کرده بود matheness بود. مثال دیگه که زده بود من راجع بهش صحبت کردم که میگه در بسیاری از علوم اومدن با نشون دادن فرمول ریاضی و ابداع‌های ریاضی سعی می‌کنند در واقع مجاب‌کنندگی بودنشون رو ببرن بالا و در واقع توی پی اس‌های مجاب کننده یا حرف‌های مفت مجاب کننده مثلاً شما میای راجع به خوشبختی، راجع به نمی‌دونم توان موفقیت، نمی‌دونم موفقیت عبارت است از آی کیو ضرب در شخصیت تقسیم بر تلاش به اضافه اعتماد به نفس منهای ناکامی، فرمول ارائه میکنی. بعد شما دوست داری این فرمولا رو حفظ کنی. حس می‌کنی تو این کتابا میرم می‌خونم و میفهمی پس راز من اینه. من عدد ناکامیم به این دلیل پایینه. مثلاً آی کیوم پایینه. نمی‌دونم ولی میگم صرفاً اینا برای فریب دادن شما هستند. یا باز میگه جالبه که همون مثال‌هایی که گفتم استفاده از تکنولوژی‌های خیلی مدرن. یک مقوله‌ای هست که مثلاً چینی‌ها یک پژوهش را چاپ کردن تو سال ۲۰۱۸ که ماشین‌های هوشمند، که در واقع کامپیوتر را طراحی کردند به اون هوش مصنوعی یاد دادن، که چهره مجرمین رو با چهره غیر خلافکاران رو می‌تونه تمایز بذاره و با ضریب موفقیت بالایی، نزدیک ۹۰ درصد با نگاه کردن به عکس پرسنلی یک نفر میتونه بگه که این آدم خلافکاره یا نه و من اینو جداگانه در اینستاگرام خدمت شما ارائه میدم و میگه که خیلی هم سر و صدا کرد ۲۰۱۶ و کلی آدم به این نقد نوشتند این مگه میشه آخه کامپیوتر این کارو کنه ولی در واقع ممکن بود که من به شما رازشون نگم، اسپویلر میشه. تو اینستاگرام برید ببینید. پس بحث‌های قشنگی داره گفتم یه جای دیگش میاد میگه که خیلی از جاها همبستگی‌ها را مقاله نشون میده ولی علیت به جای اون به شما غالب می‌شه. همبستگی یعنی این دوتا با هم دیده میشن ولی هیچ دلیلی نداره که این دلیل اون باشه یا اون دلیل این باشه یا امکان دارن هر دو معلول یک علل سوم باشند. میگم مثال‌های قشنگی می‌زنه مثلاً یه مقاله‌ای هست که ۲۰۱۸ چاپ شده. Never been kissed هیچ وقت نبوسیدنم. در واقع همبستگی اینه در دانشجویان دانشگاه‌های آمریکا، که هیچ موقع نبوسیدنت. چیزی که در آورده بود این بود که همبستگی وجود داره بین اعتماد به نفس و سن اولین بوسه و این مال خارجه. اینا رو در ایران در نظر نگیرید فقط می‌خوایم مقاله‌شو بگیم. از افراد پرسیدن اولین باری که جنس مخالفو بوسیدی کی بوده یا اون بوسیدت کی بود و دیده بودن‌ این چه همبستگی بالایی با اعتماد به نفس داره و بعد به این نتیجه رسیده بودند که اعتماد به نفس شما باعث میشه شما زودتر بتونی در واقع جنس مخالف را ببوسی و مقاله اومده بود کلی نظریه داده بود و اینا که بین این دوتا ارتباط هست ولی این مقاله تنها چیزی که میگه یک همبستگی بین ایناست. شما می‌تونین اینطوری فکر کنید که انسان‌هایی که زودتر تونستن یکیو ببوسن، احساس کردن که من خیلی کار درستم و اعتماد به نفس بالاتر میتونم داشته باشم. یا شاید اصلا یک رابطه سوم وجود داره، روابط رمانتیک. انسان‌هایی که روابط رمانتیک دارند و عاشق میشن و احتمالاً زودتر امکان داره یکی رو ببوسن و اون آدم عاشق می‌تونه اعتماد به نفس بالاتر داشته باشه یا از اون طرف اعتماد به نفس بالاتر در دانش آموزان و دانشجویان باعث میشه که اینا زودتر وارد رابطه رمانتیک بشن و در نتیجه زودتر اولین بوسه‌شونو به دست میارن یا اینکه شما اولین بار یکیو ببوسی ممکنه زودتر وارد روابط رمانتیک بشی و اون رابطه رمانتیک به شما اعتماد به نفس بالاتر بده. پس ببینید کل حرفش اینه و اینا رو توی کتاب آمار میگن، میگن اون چیزی که توی نمودار به شما نشون میده صرفاً همبستگیه و این همبستگی هیچ علیتی رو نشون نمیده و صرفاً امکان داره علیت از یک فاکتور سوم باشه یا فاکتور چهارم، پنجم، ششم. مثلاً فکر کنید یه فاکتور دیگه پنهان است مثلاً وضع مالی خانوادگی. اونی که وضع مالی خانوادگی بهتری داره طبیعتاً اعتماد به نفس بالاتری داره. توی دانشکده زودتر عاشق میشه. یا ممکنه مثلاً به توان فیزیکی برگرده اونی که توان فیزیکی بالاتری داره در واقع هیکل بهتری داره اعتماد به نفسش بهتره و اعتماد به نفس بهترش باعث شده که زودتر بره و کسیو ببوسه. و این نشون میده که چقدر اینا می‌تونه توش سفسطه صورت بگیره منتها اینو میان تیتر می‌کنن. یعنی مقاله هم این ادعا رو نداره. مثلاً آقای رفلوبیکس این به اندازه کافی باهوش هست که نیاد نتیجه‌گیری کنه ولی این امکان داره این تیتر یک پیام در شبکه مجازی بشه که شمام بگی چه جالب. هم زود بیای لایکش کنی هم بیای فورواردش کنی و اشتراک‌گذاریش کنی، که مثلا آدمای اعتماد به نفس بالا بیشتر طرفو می‌بوسن. خبرنگار هر طوری که دلش بخواد میتونه اینو بنویسه که زودتر دیگرانو ببوسید تا اعتماد به نفستون بره بالا. یعنی شروع کنید در ۱۵ سالگی، ۱۴ سالگی، در ضمن میانگین سنی که درآورده بود ۱۵ و نیم سال بود. مثلاً اومده بود دیده بود اون دانشجویی که به بیست و سه/ چهار سالگی رسیده بود و هنوز هیچکی رو نبوسیده بود اون مشکلش چیه و در واقع بیای رو این نتیجه‌گیری کنی و بیای وارد اون صفحه‌های روانشناسی زرد بشی. در واقع این یکی از قسمت‌هایی که خیلی اونا رو به نقد می‌ذاره و اونا رو حرف مفت تلقی میکنه که چگونه روانشناسی زرد از یافته‌های پژوهشی با این لطایف الحیل استنتاج می‌کنه. میگه اعتماد به نفس سرمنشا بسیاری از موفقیت‌هاست. در صورتی که در واقع این یه مقاله تنها چیزی که نشون داده پرسشنامه اعتماد به نفس داده یکی هم گفته اولین سنی که یکیو بوسیدی چه سالی بوده و در نتیجه این دو تا با هم یک ضریب همبستگی دارند. ولی اون وسط یه حرف مفتی خلق میشه و بر اساس اون حرف مفت شما می‌بینی تعداد زیادی آدما میان نتیجه‌گیری می‌کنند. پس دوستان عزیز خیلی از این سخنرانی‌های زردی که شما می‌بینید، مثلاً به خودت تلقین کن که موفق میشی و بعد مثلاً همسر ایده‌آل پیدا می‌کنی، خوب اینا اومدن از روی یه مقاله که درواقع دزدی هم نیست استفاده کردن و آمارم ساختگی نیست، آمار واقعیه، مثلاً نشون داده آدمایی که به نفس خودشون خوب تلقین می‌کنند اینا معمولاً روابط زناشویی بهتری هم دارند ولی این ادعایی که این اون رو ایجاد کرده یا اون این رو ایجاد کرده، عناصر وسط دیگر در واقع خیلی از مواقع مورد غفلت قرار گرفته شده. میگم اینا در اولین جلسات روش تحقیق و آمار اینا رو به شما میگن ولی وقتی مثال‌های بامزه‌اش را شما ندیده باشی، خواهی دید که چگونه ممکنه آدم گمراه بشه و خود شما فکر کنید که آره راست می‌گن، می‌گن بچه مدرسه‌هایی که خیلی اعتمادبه‌نفس بالا دارند این‌ها مثلاً بیشتر می‌تونن با جنس مخالف رابطه عشقی برقرار کنند یا مثلاً آمار دیگه‌ای که خیلی هم سروصدا کرد و اینا می‌گم استخراج مثال‌هاش قشنگه. بیشتر از جاهایی که خیلی viewer داشته، خیلی بازدیدکننده داشته، خیلی لایک داشته بوده. مثلاً پژوهشی اومده ادعا کرده بین سن مرگ موسیقی‌دان‌ها و ژانر موسیقی که اینا کار می‌کنند یک ارتباط خیلی جدی هست. مثلاً اونایی که بلوز و جاز و کانتری کار می‌کردند یا کاسپین، سن متوسط مردنشون شصت و پنج سال بود چه زن چه مرد. تو این صفحه 31 شما می‌بینید. پاپ مثلاً این‌جا بود ولی نگاه کنید راک میاد پایین‌تر و موسیقی پانک و از همه کم‌تر متال، رپ و هیپ هاپ بوده که میانگین سن مرگ افراد سی تا سی و پنج سال بوده. یعنی شما تقریباً نگاه کنید اگه این منحنی رو نگاه کنید ‌این منحنی خیلی فراگیر شد. این یه نمونه دیگه‌اش رو هم تو سایت‌های مختلف زده‌اند. توی سایت‌های روان‌شناسی از این استناد شده. توی روان‌شناسی زرد استفاده شده. که نوع موسیقی‌ای که کار می‌کنی طول عمر تو رو نشون می‌ده و درواقع اومدن دیدن که نگاه کن که موسیقی‌دان‌های متال، رپ، هیپ هاپ چه‌قدر عمرشون کمه در مقایسه با موسیقی‌دانان بلوز جز، گاسبل و اینها. این‌جور چیزام قدرت باز گردش دارند. یعنی هر کس اینا رو می‌بینه زود برای یکی دیگه می‌فرسته که وای چه پژوهش جالبی اگه هیپ پاپ کار کنی، نصف اونایی که جز کار می‌کنن عمر خواهی کرد. درصورتی‌که وقتی نگاه می‌کنی اینم همون زامبی استیتکسه. مثلاً ایراد توش خیلی زیاده. مثلاً ایرادی که توی این منحنی پیدا کردن اینه که خیلی خوب، این سه موسیقی، موسیقی‌های جدیدتره. در نتیجه افراد زیادی توی این موسیقی هستند که هنوز زنده‌اند و دارند این موسیقی رو دنبال می‌کنند. این آمار بهشت‌زهرا شونه، این آمار مرگ‌ومیرشونه، که آره وقتی یک چیز جدید باشه مثلاً شما فرض کن میانگین سنی افرادی که اون موسیقی رو دارن کار می‌کنن سی تا سی و پنج سال باشه، پنج نفرشون هم بمیره، میانگین سنی مرگ‌ومیر می‌شه همون سی/ سی و پنج سال و پا به سن که گذاشتن کم‌کم اینم میاد بالا و حالا نمی‌خوایم از هیپ هاپ و رپ و متال دفاع کنیم ولی می‌خوام بگم که این آمار، آمار فریبنده است. مصداق درواقع فریب دادن طرف با یکسری آماره و بعد از روی این میان نمی‌دونم کلی نظریات به قول خودش bull shit می‌سازند که آره هیپ هاپ ذهن رو این‌جوری می‌کنه، ما رو این‌جوری می‌کنه، بعد شما این میشی، این شخصیت هستید و باعث مرگ زودرس میشه و سیستم کرتیکواستروئید رو فعال می‌کنه. می‌گه درصورتی‌که کل این توضیحات که پشتش اومده BSئه. شما آمار پایه‌ات ایراد داره. شما باید این آمارو اصلاح کنید که از این تعداد که شما فوتی داشتید خب اینا فوتی ان دیگه و این آمارشونه. باید ببینی چند نفر هنوز زنده ان و بعد یه تحلیلی بکنید که اونا کی خواهند مرد. یعنی درواقع دیتایی که شما داری فقط مرده‌ها نیست زنده ها رو هم باید کنارش داشته باشید. پس یکی از چیزای مهمی که او درواقع مرتب یادآوری می‌کنه اینه که چگونه افراد می‌توانند با جعل آمار یا حتی وارونه نشان‌دادن آمار شما رو فریب بدن. مثال دیگه: ارتباط سرطان تیروئید با گلای فوسید که درواقع یک ماده شیمیاییه که ارتباط داره، ببینید چقدر دقیق منطبق هست بر تعداد موارد سرطان تیروئید. درصورتی‌که شما وقتی منحنی رو نگاه می‌کنی متوجه می‌شی که منحنی رو جعل کردن، یعنی جعل نیست، ‌این واقعیه و یه جور بد به شما نشون دادن. این‌جا رو نیومده تعداد موارد سرطان را صفر بگیره، بلکه اومده چهار گرفته یعنی اگر در واقع این منحنی رو می‌کشید پایین شما ارتباط را به گونه‌ای دیگه می‌دیدی و در واقع این‌جا نگاه کن یه جایی هست که به صفر می‌رسه و زیر صفر هم می‌تونه بره پس درواقع منحنی رو بد انطباق کردند یعنی با تغییر دادن مقیاس دو طرف و نقطه صفر دو طرف این منحنی‌ها رو روی هم منطبق کردند. یعنی گاهی اوقات افراد برای‌اینکه اون دستور کار خودشونو دنبال کنن این شیطنت‌ها رو مرتکب میشن. یا مثلاً مثال دیگه: مثلاً نگاه کنید می‌گه که طرف ممکنه تیتر بسازه که سهام شرکت فیس‌بوک سقوط جدی کرد و شما این‌جا نگاه می‌کنید این منحنی رو نشون شما می‌دن که به‌خاطر این سیاست یا به‌خاطر این رفتار این اتفاق افتاد و شما در اسلاید سی و چهار می‌بینید منحنی این‌جوری بوده بعد یه دفعه چه افتی کرده و در صورتی که اگر اصل منحنی رو به شما نشون بدن اینه. بقیه منحنی رو نگاه کنی دیگه اون حس رو نداری که این سهام چرا افتاده. میگیم که این جزو نوسانات طبیعیش بوده. یعنی چگونه با دست‌کاری کردن مقیاس و طرز نشون دادن می‌تونن شما رو فریب بدن. یا مثلا این یکی رو نگاه کنید. این رو طرفداران‌ عدم گرمایش زمین، اونایی که معتقدند تولید دی‌اکسید کربن خیلی نقش نداشته و سوخت‌های فسیلی خیلی نقش نداشته، دارند به شما نشون می‌دن و می‌گن نگاه کن درواقع زمین گرم شده و اومده بالا، ولی چند سال اخیر دیگه که گرم نشده می‌بینی از دوهزار و یک تا دوهزار و شونزده خیلی فرق نکرده. شما اینجا رو نگاه می‌کنید و می بینید این‌جا خیلی رفته بالا. پس این فاجعه هرچه بود مثل این‌که داره کنترل می‌شه. ولی شما که این پایین رو نگاه کنید متوجه می‌شید که مقیاس این پایین رو، سی سال، سی سال رسم کرده و این‌جا اومد یک‌سال، یک‌سال رسم کرده. یعنی شما اگه این منحنی رو نشون یکی بدی و به ‌اصطلاح بگه که دوستان عزیز ببینید توی کره زمین داشته تولید دی‌اکسیدکربن زیاد می‌شده ولی خوشبختانه تونستیم کنترلش کنیم. ببینید این سال‌ها خیلی رفته بالا؛ از 1901 که خودرو اختراع شد خیلی رفته بالا و در صورتی که این مقیاس‌ها و پایینش حواس‌تون باشه می‌بینیم مقیاس رو‌ متناسب انتخاب نکرد. اگه متناسب انتخابش بکنند ‌این شکلی می‌شه. یعنی بیان این پایین این کار را نکنند که این‌جا سی سال، سی سال نشون داده و بعد یه سال یه سال. اگه همه‌اش رو بیان یه جور نشون بدن می‌بینی که هیچ کند شدنی درکار نیست و مرتب داره رو به بالا می‌ره. پس ببینید با یک گراف شما ممکنه رودست بخوری و ادعایی که الان مطرحه توسط دانشمندان اینه، همون حرف‌ گری کاسپاروف که می‌گه این‌قدر شما بمباران می‌شی که مثلاً یک کسی همین رو درست می‌کنه، می‌ذاره توی تلگرام، می‌ذاره تو اینستا و زیرش می‌نویسه فریب کربن دی اکسید و شماهام دیگه فرصت نداری خیلی آنالیزش کنی. بعد نتیجه‌گیری می‌کنیم که داستان سروصدای بیخود بوده و بسیاری از این چیزهایی که در واقع شما می‌بینید در شبکه‌های اجتماعی، در خیلی از این صفحه‌ها حتی اونایی که خیلی هم زرد نیستند خبرگزاری‌هایی مربوط می‌ببینید که چگونه دست‌کاری شده. مثال دیگه‌ای می‌زنه صفحه 38 که من این اسلاید رو از کتاب انتخاب کردم؛ ببینید صحبت سر اینه که پول‌دارها تو آمریکا بیش‌تر مالیات می‌دن یا فقرا. یه بحثیه که الانم فکر کنم این مناظره‌های انتخاباتی و اینا خیلی هست و این‌جا اومده میزان مالیات دادن را مشخص کرده به تریلیون دلار و این‌جا میزان درآمد دهک‌ها یا صدک‌های مختلف جامعه رو نشون داده. ببین هر سه‌تای این منحنی یکیه. یعنی براساس یه آمار ساخته‌شده. هر سه تای این نمودارها. منتها آن‌چه که این پایین هست، این دسته‌بندی این واحدها است. این‌جا اومد گفت اونایی که درآمدشون بین صفر دلار تا صد هزار دلار در ساله، اونا که درآمدشون صد هزار دلار تا دویست هزار دلار در ساله، اونایی که دویست هزار دلار تا پونزده هزار دلار در ساله و اونایی که بالای ده میلیون دلار است و در واقع اگر منحنی رو این‌جوری رسم کنی طرف یه نگاه می‌ندازه می‌گه مثل اینکه هرچی فقیر‌تر می‌شیم بیشتر مالیات می‌دیم. این چه جامعه‌ایه؟ از فقرا مالیات می‌گیرن و مثل همون جامعه اون جنگل شرووده که رابین هود قیام کرده و داروغه‌ی ناتینگهام که از فقرا مالیات می‌گیرید و پول‌دارا اون‌قدر مالیات نمی‌دن. درصورتی‌که بیایید دهک‌بندی‌ها رو یه جور دیگه کنی. مثلاً بیای این‌جا بگی صفر تا بیست و پنج هزار، بیست و هشت و صد هزار، این منحنی عوض می‌شه و شما این حس رو خواهی داشت که طبقه متوسط داره مالیات میده و باز براساس همون داده‌ها بیای این‌جوری دهک دهکشون کنید یا دسته‌بندی شون کنید: هزار تا پنج هزار، پنج هزار تا ده‌هزار، ده‌هزار تا پنجاه هزار و بعد آخر سر بیای بگی بالای دویست هزار. شما کاملاً حس می‌کنی که پول‌دارها دارند در آمریکا مالیات می‌دهند. یعنی ببینید چقدر راحت می‌تونن بدون اینکه داده رو درش تقلب کرده باشند صرفاً از طریق بازنمایی اون، شما رو فریب بدن. درنتیجه اونی که در جامعه آمریکا یه مقدار رویکرد سوسیالیستی و چپ داره، نمودارشو این‌جوری رسم می‌کنه و می‌گه ببین فقرا دارند مالیات میدن و این‌ چه جامعه ای هستش و از اون طرفم اون جمهوری‌خواه‌ها و راستی‌ها احتمالا خواهند گفت نخیر اتفاقا پولدارا هستن که دارن مالیات می‌دن. این طبقات فقیر ببین اصن مگه چقدر مالیات می‌دهند؟ درصورتی‌که شما از طریق خوشه‌سازی‌ها می‌تونی اون رو تغییر بدی. یا این مورد علاقه‌ی منه. می‌گه که شما می‌تونید همین کار رو راجع‌به ژنتیک و هوش یا دستاورد تحصیلی بکنید. ببین منحنی رو این‌جوری می‌تونی رسم کنی که بیای ده‌درصد، ده درصد رو با هم دسته‌بندی بکنی. یعنی ده تا دهک درست کنی از نمرات آزمون‌های جی دبلیو اس ژنتیک و اون ژنوم استادی و اینم نمره هوش افراد یا دستاورد تحصیلی که این‌رو معادل نمره هوش می‌گیرند یعنی هشت کلاس، نه کلاس درس خوندن و درواقع می‌گه که اگر ما ده گروه یا ده دهک در واقع از تغییرات ژنتیکی ببینیم شما واضح می‌بینی که ژنتیک چقدر نقش داره و اونی که درواقع از اون در اون شاخص‌ها در اون دهک آخر هست عملاً دو کلاس بیشتر درس خواهد خوند. یعنی واقعاً شما با این نگاه کردن به این منحنی این‌گونه نتیجه می‌گیری که هرچقدر شاخص هوش عوض می‌شه میزان تحصیلاتم می‌ره بالا پس مقدار زیادی از تحصیلات و هوش ما ژنتیکی است. درصورتی‌که این به‌دلیل اصطلاحاً دسته‌بندی این‌جوری شده. اینا اومدن فرض کن بین سی تا چهل درصدو با هم‌دیگه یه دسته کردن، میانگینشو رسم کردن. همین رو می‌شه این‌جوری رسم کرد. این همون آماره. شما دیگه اون‌قدر پررنگ نمی‌بینیش. یعنی شما وقتی اون رو میان درواقع دسته‌بندی می‌کنن شما به ذهنت میاد که واضحه دیگه هرچی ژنتیک تغییر می‌کنه درسم می‌ره بالا. ولی این‌جا شما دیگه اون واضح بودنو نمی‌بینید. یک گرایش می‌بینی ولی یه جور دیگه اون مجاب‌کنندگی قبلی رو تو ذهن شما نداره. حتی خیلی‌ها اذعان کردن که نه به‌نظرم خیلی فرق نکرده که این این‌جاست و می‌دونم اون‌جاست. اینه که منهای دو ده نمره ژنتیک داره دقیقاً همون آورده که با این آورده یعنی می‌بینیم طرز نشون دادن درواقع داده‌ها می‌تونه بر میزان مجاب شدن شما اثر بگذارد یا مثلاً ده کتاب شایعی که در دنیا خوانده می‌شود و شایع‌ترین کتاب در کشورهای انگلیسی‌زبان؛ انجیل هست و بعد شما میای هری پاتر رو داری، ارباب حلقه ها رو داری، داوینچی کد رو داری بر باد رفته رو داری و خاطرات آنا فرانک رو داری. حالا من مثال زدم و چند تا رو ولی شما نگاه کن با یک ظرافتی شما رو گول زدن شما حس می‌کنید که بین آنا فرانک و بربادرفته و داوینچی کد خیلی فاصله نیست و بیشترین فاصله جدی رو با انجیل مقدس دارید درصورتی‌که شما نگاه کنه خب این‌جا نقطه صفر اینجاست و این پایین برای فریب چشم این‌جوری رسم شده شما این زیر رو نبینی واقعاً حس می‌کنی که تفاوت خیلی بیشتر است. یعنی طرز بازنمایی درواقع نمودارها می‌تونه گول زننده باشه. باز این نمودارهایی که حتی توی cia fact book چاپ شده که درباره‌ی مثلاً میزان زمین‌های قابل کشت کشورهای مختلف است. خوب شما اگر نگاه کنید به ازای سرانه و هکتار به‌ظاهر میاد که خب این یک نمودار منطقی هست ولی نمودار ایراد جدی داره برای این‌که فرض کنید اونی که این‌جا هست شما که منحنی خیلی کوتاه می‌بینی ازش درصورتی‌که معادل این این‌قدر نیست معادلش این‌قدره و چون اینایی که به مرکز نزدیک‌ترند خیلی تو چشم به‌نظر می‌آد که ضعیف تر هستند درصورتی‌که اونی که از مرکز دوره چون درواقع دایره بزرگ‌تری رو رسم خواهد کرد، به‌نظر شما میاد که خیلی فاصله زیاده. حالا معلوم نیست این به قصد فریب افراد این‌جوری رسم شده یا این‌که اون کس که داشته ‌این نمودار رو تهیه می‌کرد و حواسش به این ظرافت نبوده. یا مثال دیگه میزنه. اینم جالبه که راجع به میزان مرگ‌ومیر تصادفات در تصادفات رانندگی باتوجه به سن هستش. خب شما اگر این نمودار رو نگاه کنی می‌گم زامبی استیسکس که می‌گم اینه دوستان و این کتاب می‌گم چیزایی که داریم که خیلی بدیهیه کسی که الان مخاطب هست و ممکنه این فایل رو گوش می‌دی میگی من تحصیلات دانشگاهی دارم و همینا رو تو آمار خوندم که باید مشخص بشه اون نمونه گیری از چه جمعیتی بود و جمعیت چقدر بود چند درصد رو تشکیل می‌ده و وقتی توی رسانه‌های زرد مطرح می‌شه شما رو فریب می‌ده. مثلاً شما همین رو نگاه کنید این دوره می‌گه تعداد موارد فوت بر اثر رانندگی در آمریکا در سال 1388براساس سن: شونزده تا نوزده‌ساله، بیست تا بیست و چهار ساله، همین‌جور میره تا بیست و پنج ساله و بالا. خوب این منحنی رو شما نگاه کنید حس می‌کنید اینو یه جا براتون چاپ کنند که جوون‌ها تو تصادف‌ها خیلی بیشتر کشته می‌شند مثلاً هشت هزار نفر، هشت هزار و خورده‌ای نفر، بیست تا بیست چهار سال کشته می‌شه درصورتی‌که هفتاد تا هفتاد و چهار ساله خیلی کم‌تر کشته می‌شه هزار نفر و با یه نگاه سریع شما این حسو میکنی که جوونا تند می‌رونن و اصلاً رعایت نمی‌کنند. اصلا تمام مشکل ما، بدبختی ما از همین جووناست و زود هم طرف میگه جوونا احساسی هستن، جوان کنترل تکانه ندارد، جوون‌های جدید این جورین دیگه، بی‌مبالاتن. گاز می‌ده آدم رو زیر می‌گیره و اینم منحنی و اینم علم دیگه چی از این نمودار بهتر. درصورتی‌که این نمودار رو باید یه جور اصلاحش کرد مثلاً می‌گه تعداد مرگ‌ومیر با توجه به سن در مقیاس مقدار رانندگی. حالا اینا که شما نگاه کنید میگید این سالمندان چقد خطرناکن! یعنی فرق این اسلاید اینه که در این‌جا این را لحاظ نکرده که یک هفتاد و پنج ساله در طی یک‌سال چند کیلومتر چند مایل رانندگی می‌کنه. خب وقتی شما مقدار رانندگیت خیلی کم‌تره طبعاً تعداد تصادفاتتم کم‌تره. اگر بیای با اون استانداردش کنی، منحنی ببین کاملاً برعکس می‌شه. یعنی شما هر چی سن می‌ره بالا طرف البته شونزده تا نوزده ساله‌ها کماکان همون مقدار رو خواهند داشت یعنی شما این‌جا یک اعاده حیثیتی می‌شه در این نمودار از افراد بیست تا مثلاً سی و پنج سال یعنی شما متوجه می‌شوید که منحنی رو نگاه کنین اتفاقا شاید بیست و پنج ساله‌ها تا سی ساله‌ها و سی و پنج ساله‌ها خیلی آدم‌هایه محتاطی هستند چون با توجه به اون مایلِج و اون مقدار رانندگی براساس کیلومتر که انجام می‌دهند تعداد موارد فوتیشون خیلی کمتره و سالمندان دوباره خطرناک می‌شن و خیلی خطرناک‌تر می‌شن یعنی بین دو منحنی براساس یک نوع داده با بازنمایی متفاوت می‌تونه نتیجه رو برعکس کنه. این‌جا یک کسی که ضد سالمندان باشه و سیاست‌های محدودکننده سالمندان داشته باشه می‌تونه منحنی رو این‌جوری رسم کنه و اون کسی که می‌خواد جوان ستیزی کنه منحنی رو این‌جور رسم کنه و شما می‌بینید چقدر راحت می تونید گول بخورید یا باز بازنمایی متفاوت این‌جا اومده گفته که خب تعداد افرادی که توی ایالت اونتاریو به حزب لیبرال یا حزب ان دی پی و اینا رأی دادن. خطاش چیه؟ خطاش اینه که ان دی پی این‌جا سی و پنج درصده درصورتی‌که اونتاریو پی‌سی این‌جا چهل درصده ولی این رو چون جلو گذاشته و پرسپکتیو هست شما حس می‌کنید که این خیلی قوی‌تر از اونه و در واقع اگر این اعداد روش رو ننویسه شما میگی این جلوئه دیگه و این همه رو گرفته در صورتی که این خب به‌خاطر اختلاف دید شماست. در این راه یعنی می‌گم کتاب متنوع هست از درواقع کلک‌هایی که می‌شه زد و درعین‌حال هیچ دروغی هم نیست و طرف می‌گه دروغ نگفتم اینا ولی حواس‌مون باید باشه که منحنی‌های پایه سه‌بعدی از جلو این‌جوری دیده می‌شن که درواقع سهم اونی که جلو هست به‌صورت کاذب خیلی پررنگ دیده خواهد شد. یا چند مطالعه دیگه هستند که اینم شبیه اون مطالعاتی هست که ما توی اون تشخیص مجرمین از افراد غیر خلاف‌کار دیدیم. مثلاً اومده بودند دیده بودند که آیا سیستم هوش مصنوعی می‌تونه پنومونی رو تشخیص بده و دیده بودند که آره سیستم هوش مصنوعی کامپیوتر یاد گرفت که تصاویر پنومونی رو خیلی راحت جدا بکنه از تصاویر غیره پنومونی ولی مثلاً می‌گم همیشه ظرافت‌هایی هست که مورد غفلت قرار می‌گیره مثلا سنجیده بودند که هوش مصنوعی در بسیاری از موارد و برخی مقالات از روی نمای روی یک اینکارو نمی‌کنه از روی این نمای جانبی که مثلاً این تگی که این‌جا گذاشته و مثلاً مربوط به اورژانس بوده این کار رو می‌کنه و توی اورژانس معمولاً مریضا بدحال ترن و تگ‌شون هم فرق می‌کنه و درواقع کامپیوتر از روی ریه نمی‌گفته که این پنومونی داره از روی اینه که این عکس تو اورژانس گرفته شد می‌فهمیده که این پنومونی داره چون موارد پنومونی توی اورژانس بیشتر بوده. می‌گم اینا همش خطاهاییه که خیلی فراگیر می‌شه و بعد میان اصلاحش می‌کنن. مثلاً یکی نرم‌افزاری اختراع کرده بود که می‌گفت سگ هاسکی را از وولف، از گرگ خیلی‌خوب تمایز می‌ده این نرم‌افزار هوشمند ولی بعداً دیدن که نخیر نرم‌افزار هاسکی را از گرگ تمایز نمی‌ده از پس زمینه تمایز میده. هاسکی ها معمولاً توی دشت و بیابان نیست عکساشون ولی گرگ‌ها توی دشت و بیابان و برف عکساشون هست و درواقع دیده بودند که چهره هاسکی نیست که نرم‌افزار اون رو متمایز می‌کنه، پس‌زمینه هاست و درواقع چهره‌اش رو هم دربیارن بازم می‌گفت عکس مربوط به هاسکی هاست یا باز مثال دیگه‌ای هست که یه مقدار این فایل طولانی شد و من یه مقدار مجبورم سریع‌تر خدمتتون توضیح بدم این رو من جایی دیگه بحث جدی خواهند کرد راجع بش. اونم اینه که در خیلی از موارد داده‌ها تقلبی نیستند دوستان فقط همون جور که من راجع‌به اون مثال چهره جذاب و اخلاق خوب گفتم بخشی از داده منتشر می‌شه. این یکی از بلیه‌های جدی علم معاصره. یعنی در واقع این علم همه‌ی واقعیت رو به شما نمی‌گه و وقتی همه واقعیت منتشر نمی‌شه شما شاهد یک سوگیری هستی و نویسنده‌های مقاله مدعی هستند که یکی از شایع‌ترین راه‌های ایجاد بول شت BS در جهان معاصر اینیه که برخی از قسمت‌های داده‌ها داده نمی‌شه و اونایی که سوگیری خاص داره منتشر میشه. مثالی که می‌زنه از مقاله مشهوری هست نیوانگلند ژورنال مدیسون چاپ‌شده و درواقع 2008 سروصدایی به پا کرد او گفته بود که نگاه کن مثلاً اومده و تعدادی از داروهای ضدافسردگی رو بررسی کرده بود که هفتاد و چهار مطالعه روشون صورت‌گرفته بود. این نمایی که شما در بالای صفحه می‌بینید اون چیزایی که تو ژورنال چاپ شد و توی ژورنال ببینید به‌غیر از سه مورد بقیه‌ی اونایی که چاپ شدن همه اثربخشیه مثبت داشته‌اند درصورتی‌که وقتی رفت اسناد اف‌دی‌ای رو نگاه کرده ببینید خیلی فرق داره. یعنی از اون هفتاد و چهار تا فقط سه‌تا از منفی‌ها چاپ شده درصورتی‌که در واقعیت تعداد بسیار زیادی منفی وجود داشته به این می‌گن سندروم کشوی میز و ادعاش بر اینه که یکی از مشکلاتی که علم معاصر داره اینه. اون یافته‌هایی که توشون جواب می‌گیری توشون مدنظر پژوهشگر هست به مطبوعات و ژورنال‌ها راه پیدا می‌کنه. اونایی که جواب نمی‌گیری یا در واقع خود پژوهشگر منصرف می‌شه که خب مثلاً جواب منفی گرفتم چیه بفرستم چاپ بشه یا این‌که سردبیر ژورنال حس خواهد کرد که خب این دیگه ارزش نداره شما بین این مسئله و مسئله دیگه هم‌بستگی پیدا نکردی خب که چی؟ در نتیجه اون رو می‌ذاره کنار و چاپش نمی‌کنی ولی اون که همبستگی پیدا کرده باعث چاپ شدنش می‌شه. این پدیده یکی از سوگیری‌های متأسفانه مشکل‌ساز را در مطالعات نشون می‌ده. اینم باز به همون مقاله برمی‌گرده یعنی شما وقتی نگاه می‌کنید اونایی که منفی بود هیچ کدوم‌شون چاپ‌نشده حالا چرا چاپ‌نشده شاید سردبیر دوست نداشته یا خود نویسنده دوست نداشته و وقتی اون چاپ نشده‌ها رو بیان با چاپ‌شده‌ها مخلوط کنن می‌بینید جواب‌ها خیلی متفاوت خواهد بود. بازم می‌گم این رو من به‌عنوان یک پژوهش تأمل‌برانگیز در فرصتی جداگانه بیشتر خدمتتون ارائه خواهم داد ولی در واقع صحبت اساسی این نوع مقالات اینه که بایستی سیستم علمی و کم‌کم داره این مد می‌شه که اون پژوهش‌هایی رو کردی و جواب نگرفتی هم اون‌ها رو هم اگه راست می‌گی بیار و درواقع منتشر کن وقتی اون کار رو می‌کنی یه دفعه شما می‌بینید اثربخشی خیلی از مداخلات یک تفاوت محسوس می‌کنه. مثلاً از نمره کوهن نیم به دو دهم کاهش پیدا می‌کنه. که شما می‌بینیم منحنی خیلی جابه‌جا می‌شه و در واقع مدعی هستند که بخشی از این قضیه برمی‌گرده به مقوله چاپ شدن انتخابی داده‌ها و روش‌های الان که داره راه می‌افته درواقع این شبهه رو ایجاد کرده که خیلی از مطالعاتی که ما الان داریم می‌بینیم هم‌بستگی بین a و b‌پیدا شد این هم‌بستگی جدی نیست بر این‌که معادل‌این مقالات زیادی بود که این هم‌بستگی رو نشون ندادن ولی خب سردبیر از چاپ کردن اون‌ها امتناع کرد. خب فک کنم دیگه خیلی فایل طولانی شد من دوست داشتم تو همین جا جمعش کنم ولی اجازه بدید فایل رو متوقف کنم که چند دقیقه‌ای از بحث مونده رو در فایل بعدی خدمتتون ارائه خواهم داد.
Document