سلام مجدد خدمت شما دوستان و علاقمندان عزیز. بخش دوم از بررسی کتاب calling bull shit رو دنبال میکنیم. به نظرم کتاب جالبیه و باز تأکید میکنم با وجود اینکه بعضی جاها خیلی چیزهای ابتدایی رو ارائه میده که هرکسی دورههای پژوهش و روش تحقیق رو گذرونده باشه اون رو میدونه، ولی تأکیدی که بر این مباحث داره و همچنین مثالهای جالب و شیرینی که ارائه میده بهنظر من کتاب رو خواندنی میکنه و بعضیها میتونن بعضی قسمتاشو حالا با اغماض رد بشن از روش ولی اون لب کلامش چیزهای جالبی دربرداره. اگر خاطرتون باشه در قسمت قبل روی این تأکید کردم که نویسندهها اصرار بر این دارند که ما به نوعی بیاییم و این مقوله حرفهای بیسروته و قلنبه سلنبهای رو که در زمینههای شبه علمی زده میشه نپذیریم و به جدیت در مقابل اون بایستیم. اما کل بحث اینها برنمیگرده به خرافات و مباحث ضدعلمی، بلکه گاهی و شاید به قسمت عمدهای از کتاب اشارهای به این داره که خیلی از نویسندهها میان مطالبی رو که درواقع بهظاهر علمی هستند ولی اون نتیجهگیری رو نمیشه ازشون کرد، به نقد میکشند و ادعاش بر اینه که ما که تعداد زیادی پژوهشهای پایه داریم که این پژوهشهای پایهها به فرض اینه که درست باشن، روش تعقیبشون درست بوده باشه، نگارنده توش تقلب نکرده باشه که در بخشی هم بهش اشاره میکنه که میگه تقلب هم افزایش پیدا کرد و حالا دلیلش رو هم به بحث میذاریم اما اون یافتهای که وجود داره توسط عدهای واسط یا عدهای که به خبرپراکنی، خبرنگاران علمی، ژورنالیزم علمی میپردازند یا حتی خبرگزاریها نتایجی رو از اونا استنتاج میکنند که مدنظر پژوهشگر نبوده یا اینکه درواقع دستکاریشده دیدگاه اونه و اون رو در قالب مثالهای جالب و بامزهای ارائه میده که من فکر میکنم که این مثالها رو شما جاهای مختلفم میتونید پیدا کنید ولی مثالهاییش رو که بهنظر من جالب نبودن و من بهصورت خلاصه در آوردمشون خدمتتون ارائه میدم. پس ببینید بخش دیگری از این کتاب چالش ادعاهای علمی هست که پشتوانه درواقع قوی ندارند. بهعنوان مثال اومده گفته مثلا پژوهشی اعلام کرده که هرچقدر قیمت مسکن میره بالا میزان باروری انسانها میاد پایین. مثلاً یک منطقه از آمریکا رو اومدن بررسی کردن و شما نگاه کنید شما یک همبستگی منفی و معکوس میبینید دیگه. اونجا افزایش قیمت مسکن هست و اینجا کاهش نرخ باروری هست که از یه نرخ باروری فرض کنید استاندارد اگر صفر درصد در نظر بگیریم هرچقدر مسکن گرون شده شما میبینید تعداد فرزندآوری کمتر شده. مثلاً اینجا وقتی افزایش housing یا قیمت مسکن رسید به شصت درصد، شما شاهده کاهش ۲۰ درصدی نرخ باروری افراد بودین و میگه به کلی روی این برداشت کردن و یه عده خبرنگار اومدن گفتن که خونه داره گرون میشه و مردم دارن بچه کمتر میارن. دارم اینا رو به عنوان تمرین ذهن میگم اما نگاه کنید این اولاً هیچ چیزی رو ثابت نمیکنه. ادعای اون فرد که هر چقدر مسکن گرون بشه، مردم بچه کمتر میارن قابل اثبات نیست. اونچه که شما اینجا میبینید، فقط یک همبستگی آماریه. میتونه دلایل دیگه داشته باشه یا حتی میتونه برعکس باشه؛ مثلاً اشاره میکنه که خانوادههایی که فرزند کمتری دارند یا بچه کمتر میارن شاید اصلا متمولترند و دوست دارند توی این ملک و مسکن سرمایهگذاری کنند. در نتیجه اون خانوادهها به محلههایی میرن که گرونتره و پول و سرمایههاشون رو میبرند سرمایهگذاری میکنند در اون محلهها و این باعث افزایش قیمت مسکن میشه یا اصلا ممکنه عنصر سومی باشه. شما با یک طبقه نوظهور مواجهید که دوست دارند پول زیادی در خانه بذارند و به دلیل اینکه اینها تکنوکراتاند و تحصیل کردههای بالا هستند و شاغل هستند، فرزند کمتری دارند و در نتیجه و آنچه که اینجا میبینید صرفاً یک همبستگی آماری است و شما نمیتوانی از روی این نتیجه بگیری که خونه که گرون بشه مردم کمتر بچه میارن. یا بخشهایی از کتاب اختصاص پیدا کرده که ازاین مدل همبستگیها ما به وفور میتونیم پیدا کنیم. بعضیهاش جنبه طنز داره مثلاً نگاه کنید نوشته در سالهای ۱۹۹۹ تا ۲۰۰۷ ببینید این منحنیها چقدر شبیه هم حرکت کرده، در واقع این منحنی روشنتر تعداد موارد قتل توسط اشیا داغ و برنده است مثلاً آب جوش، گاز آتشزا، آتش زدن و اینا و این سن میانگین افرادی است که به عنوان miss America برنده شدن و شما میبینید و میتونید نتیجه بگیرید که بین سن miss America و کشته شدن توسط بخار داغ و اشیای داغ یک همبستگی وجود داره. در صورتی که صرفاً میتونه یک جعل آماری باشه ولی ببینید این آمار رو جعل نکردند. من اصلاح کنم به گونهای انتخابش کردندکه این گونه به نظر بیاد و وقتی شما ادامه این منحنی را تماشا میکنید و میبینید این کاملاً برملا میشه که این تصادفیست. یعنی این قطعه رو در اسلاید قبل دیدید و ببینید چقدر خوب با هم ادامه دادند و اینجا همون قطعه است ولی اومدن از سال ۲۰۰۸ تا ۲۰۱۵ ادامه دادن و میبینید کاملاً به هم میخوره. پس میگه در واقع میتونیم گزینشی، یافتههای علمی را منتشر کنیم و خیلی از این چیزهایی که شما در شبکههای مجازی میبینید، در اخبار میبینید، نمیدونم در تاثیر خوراکیها میبینید، تاثیر بعضی از رفتارها به بیماریها، بروز بعضی از پدیدهها و ارتباط اون با مثلاً گوشی تلفن و اینا، خیلیاش میتونه به صورت گزینشی انتخاب شده باشه. باز شما نگاه کنید؛ مورد دیگه میگه مرگ بر اثر مصرف داروهای ضد انعقاد و میزان دکتراهای جامعهشناسی در آمریکا از سال ۱۹۹۹ تا ۲۰۱۰. ببینید چقدر منحنی شبیه همه و وقتی شما نگاه میکنی و این حس رو داری خوب چه همبستگیها و چه مرگ و میر بر اثر مصرف داروهای ضد انعقاد و و اونایی که phd گرفتن توی رشته جامعهشناسی وجود داره. و نگاه کنید اشارهای که میکنه اینه که شما علاوه بر اینکه باید شک کنید به همچین آمارهایی، باید ببینید این آمار تقلبی نیست، این آمار رو گزینشی به شما دادند. مثلاً نگاه کنید یکی از این کلکهایی که زدن اینه که اومدن کف رو ۵۰۰ گرفتن، ۵۰۰ نفر و بعد اینجا صفر گرفتن، پس این منحنیها خیلی به هم شبیه شدن. حتی یه دونه دیگه که نشون داده این دیگه خیلی طنزه چون میدونید توی فرهنگ خارجیها وقتی بچهها میپرسند بچه از کجا میاد، میگن اینو لک لک آورده. حاجی لکلک اینو گذاشته توی یه دستمال و آورده و این نشون داده میزان زاد و ولد در کشورهای غربی Newborn bebies این چه همبستگی دقیقی داره با تعداد موارد لکلکها! واقعا خوب میگه از این فرضیه ثابت میشه که لک لکها هستند که بچه ها رو میارن و هرچه لک لک کمتر شده بچه هم کمتر شده و میگه شما میتونید اینجور آمارهایی رو جعل کنید. پس یه بحثی که داره میگه اینه هر جا شما یه گراف دیدید، یه منحنی دیدید، به خصوص تو این خبرگزاریها، شبکههای اجتماعی، مثلا افزایش موارد مرگ و میر بر اثر فلان بیماری و در کنارش مثلاً مصرف تربچه در جای دیگه، میگی دیدی واقعاً این دو منحنی روی هم منطبقاند و از منبع معتبری هم استخراج شدن، مثلا از ژورنال لنست این آمار اومده ولی شما باید اینجوری فکر کنید که این اخبار گزینشی به شما داده شده. پس یه تمرین که شما باید انجام بدین اینه که حواستون باشه منحنیها رو یا میشه گزینشی خدمت شما ارائه داد یا اینکه منحنی را جوری رسم کرد که شما فریب بخورید و در واقع میگه تمرین کنید که در رسم این منحنی ها حواستون باشه. و در بین این بحثها یه قانون قشنگی رو ارائه داد که حیفم اومد بهش اشاره نکنم به نام قانون قانون گودهارد یا .Godhard s law این قانون چیزه قشنگیه واقعاً و میگه when a measure becomes a target it ceases to be a good measure ، میگه وقتی یک مقیاس اندازهگیری خود هدف میشود، دیگر مقیاس خوبی نیست. به این میگن قانون گودهارد. اگر شما این فایل رو دارید گوش میدید من ازتون یه خواهش دارم این قانون گود هارد رو به ذهن داشته باشید برای اینکه این قانون گودهارد خیلی از چیزا رو بدبخت کرده! معنیش چیه؟ میگه when a measure becomes a target وقتی یه مقیاس هدف میشه، مثلاً شما در نظر بگیرید هدف مدرسه چیه؟ آموزش کودکان. این یک هدفه. آموزش دانش آموزان برای آماده شدن برای رفتن به مدارج بالاتر و هدف مدرسه اینه ولی یکی از شاخصهایی که یه مدرسه خوب عمل میکنه میشه قبولیهای کنکور یا تعداد المپیادیهای اون مدرسه. چون فرض بر اینه که اون مدرسهای که بهتر درس میده لابد از توش کنکوریهای رتبه برتر پیدا میشه، تعداد المپیادیها زیاد میشه و تعداد جایزهها زیاد میشه. خوب پس این میشه یه مقیاس. قانون گودهارد میگه که اگه یک سیستمی اومد اون مقیاسها رو هدف کرد، گند میزنه به اون مقیاسها و بعد از یه مدتی شما شاهد مقیاسهایی خواهید بود که کاملاً ضد خودشان عمل می کنند. یعنی اون مدرسه دیگه به یادگیری و رشد کودک که سابقاً از راه قبولی در دانشگاه اندازهگیری میشد نمیپردازه. هدفش این میشه که رتبه کنکور خوب بیاد و اون موقع هدف گذاریش این میشه که ۵۰ نفر بیاریم که رتبهشون زیر۵۰۰ بشه و بعد از اون شما شاهد این هستید که رتبه کنکور ارزش خودشو از دست میده چون اینا با لطایف الحیل، انواع کلکها، انواع روشها سعی میکنند اون مقیاس رو بهبود ببخشند. شما این رو در بقیه حوزهها میبینید. مثلاً ارزیابی بیمارستانها، ارزیابی دانشگاهها و مثالهایی زده که حتی از دانشگاههای خوب آمریکاست که میگه یکی از مقیاسهای ارزیابی دانشگاه اینه که کلاسها چند نفریه. میانگین کلاسها چند نفر هستند. خوب این در واقع یک شاخص است، یک مقیاس است که خوب بودن دانشگاه رو مشخص میکرد ولی بعد از یه مدتی دانشگاه هدفش این میشه که تو این شاخص نمره خوب بیارن این میشه قانون گودهارد و بعد اینجوری میشه؛ خب شما شما میتونید تعدادی دروس فرعی درست کنید، ببینید حقه بازی اینطوری میشه، یه تعداد دروس فرعی درست کنید و ۱۰ نفر آدم بذارین توش یه استادم استخدام کنید و بعد اینا که میره توی آمار، میانگین کلاس میاد پایین و بعد درنتیجه شما دانشگاه خوبی میشید. یعنی به نوعی رنکینگت میره بالا و به نوعی اینو در مسئله ایران در نظر بگیرید. من قانون گودهاردو اینجا میخوام بگم که دوستان عزیز، قانون گودهارد میتونه به آینده علمی ما ضربه بزنه. یعنی اول میگفتند که هدف دانشگاه توسعه علمه ولی بعد از یه مدت گفتن نه این توسعه رو از کجا میفهمیم؟ از روی مقالهای که چاپ میشه. بعد از یه مدت اون مقاله میشه هدف دانشگاه و بعد من الان فکر کنم بعضی از شما موافقید که این مقیاس لوث شده چون شما با ceases to be a good measure یا لطایف الحیل میتونید تعداد مقالاتو ببری بالا. نمیدونم یه پژوهشو ۱۰ تیکش کنی و در ده جاهای مختلف از همدیگه هی اسم ببرید. اسم یه نویسنده رو تو ده جا بذاری که در واقع اون ISI و scopes و اینا بره بالا و قانون گودهارد اینو میگه، وقتی سیستم ها میان اون مقیاس رو اولویت خودشون قرار میدن، در زمان بسیار کوتاهی اون مقیاس دیگه به درد نمیخوره و لوث میشه. و فکر میکنم شما هم با من موافقید که دیگه قبولی کنکور و تعداد مقالات چاپ شده و استنادهای علمی چندان معیار معتبری نیست و شما میگید که اولش جالب بود، اولش به نظر میرسید مدارس خوب این معیارو داشتن ولی الان داره به ضد خودش تبدیل میشه و توش کلی کلک و ظرافت ها و ریزه کاری ها با خلاقیت بشر شکل میگیره، که در واقع اونها رو دامن میزنه. حالا مثال هایی زده، مثلا میگه بعضی ژورنال ها میان توی ژانویه بیشتر مقالاتشون رو بیشتر میکنند. چرا؟ چون توی اول سال فرصت میکنه که بیشتر بهش استناد بشه و بعد اون ژورنال اثر بخشیش میره بالا و بعد بقیه میگن که این ژورنال چقدر ارتقا پیدا کرده. در صورتی که ژورنال ارتقا پیدا نکرده بلکه با ظرافت هایی مثل این که مقالات ژانویه رو زیاد کنم، مقالات مثلا دسامبر رو کم بکنم که در واقع این روند استناد به اون در یک سال تغییر بکنه، من به طور کاذب میتونم موفقیت پیدا بکنم. منتها هشداری که نویسنده های کتاب میدن اینه که چنین چیزی توی علم داره شیوع پیدا میکنه و شما شاهد تعداد زیادی از جعلیات و موارد ساختگی هستید. اشاره قشنگ دیگهای میکنه، پس اون اصلاح گودهارد رو یاد بگیرید، یه اصطلاح دیگه داره که میگه .Zombie statistics میگه زامبی استاتیسیکس داره زیاد میشه. زامبی که خوب میدونید یعنی چی استاتیسیکس هم یعنی آمار و به طنز نوشته ۷۸.۴درصد آماری که ارائه میشود ساختگی است. خوب خود این گزاره هم ساختگیه. راست میگه. شما شاهد این هستید که مکرر توی سخنرانیها، کتابها، یه آمارایی استناد میشه ولی اون آمار زامبیه یعنی توخالیه. مثلاً فرض کنید ممکنه که بگن که نمیدونم شاخص فرض کنید که توفیق تحصیلی از ۲۰ درصد رسیده به ۳۰ درصد و همه میگن اوه پس داری بهتر میشه ولی بعد یکی سوال میکنه توفیق تحصیلی یعنی چی. بعد تو کیا و چه جوری اندازهگیری میشه و توسط کی ارزیابی شده؟ و میگه ذهن انسان معمولا به این عمق نمیره و فقط یه عددو میشنوه. راستشو بخواین جسارتاً میگم قصد توهین به کسیو ندارم ولی من خیلی تو مطبوعات و اینا دیدم و توی این شبکهها دیدم و شما آمارهایی میبینید ولی میگن هر موقع آمار دیدین یه ذره روش فکر کن که این آمارها تو کجاها اندازهگیری شده، با چه ابزاری اندازهگیریش کردن، یعنی مثلاً همین جمله رو دقت کنید۷۸ درصدی که آمار ارائه میشود ساختگی است. ساختگی بودنش رو از کجا فهمیدید؟ توی چی داره میگه؟ توی مطبوعات داره میگه؟ توی رسانهها داره؟ میگه توی شبکههای اجتماعی داره میگه؟ و چه کسی با چه ابزاری اونو اندازهگیری کرده؟ ولی جالبه همین گزاره میتونه تیتر خبر خیلی از شبکهها و مطبوعات باشه و شما میبینید خبرنگاران هم اینو مرتب استناد میکنند. توی مناظره و اینجور چیزها پس یه اصطلاحی که میگه توی سالهای اخیر مد شده اینه که انسانها مسلح شدن به آمار. راست میگه توی مصاحبهها گهگاهی مسئول سیستمی چیزی رو که میبینید و میبینید میاد عدد میپرونه ولی وقتی شما میکنید نگاه میکنید که اون عدد یک زامبیه و ارزش زیادی نداره یا مثال دیگهای میزنه چگونه انتخاب کردن نمونه، جواب رو کاملاً میتونه تغییر بده. یعنی شما از کجا میای نمونه گیری میکنی؟ که سمپل کجاست؟ مثلاً شما بیا این جمله رو تو گوگل سرچ کنی، جالبه میگه is my husband شوهر من هست… میتونید ببینید که گوگل خودش یه حالت اتوفیل داره، خودش پیشنهاد میده و از سوالهای خیلی شایعی که قبلا پرسیده شده به شما پیشنهاد میده. میگه معمولاً همچین جملههایی شاید بیادید. : شوهر من خیلی بدجنسه، شوهر من معتاد به پورنوگرافیه، شوهر من افسرده است، شوهر من خودخواهه. معمولا یکی دو تا صفت مثبت میاد. پس چه نتیجه میگیریم؟ نتیجهگیری میکنیم که وقتی خانمها تو گوگل در مورد شوهراشون سرچ میکنند احتمالاً از دست شوهر خیلی عاصین، خیلی شاکین و پیشنهادهایی که قبل از اون مورد توجه قرار گرفته و رنکینگش اومده بالا توی این سیستم معمولا چیزهای منفیه. مثلا وقتی یکی سوال داره در مورد شوهرش، خیلی سریع براش میاد که شوهر من خشنه، شوهر من به پورن معتاده، در صورتی که همینو بیای در فیسبوک سرچ کنی یا توی این شبکههای اجتماعی سرچ کنی میشه my husband is my best friend ، my husband is my life، شوهر من همه چیه، شوهر من عشق منه، شوهر من نمیدونم بهترینه، شوهر من بهترین دوست زندگی منه، شوهر من تمام زندگیمه. خوب این نشون میده اونایی که توی شبکههای اجتماعی بودن به خصوص تو فیسبوک بودن اینو در فیسبوک استخراج کردن. در واقع همیشه سعی دارند یک نماد مثبتی از شوهر ارائه بدن. افرادی هستند که زندگی رو همینطور به قول خارجیها رزی ببینند؛ زندگی براشون خیلی قرمز و صورتی و خوشاینده. در واقع در صورتی که اونایی که تو گوگل سرچ میکنند این جواب منفی رو داره پس در واقع چیزی که داره میگه اینه که شما نمیتونید بر اساس یک جمعیت خاص نتیجهگیری کنید و همونطور که گفتم خیلیا اینو میدونیم تو روش آمار، اما چون مثالهاش قشنگ بود گفتم که بگمش. یعنی شما شاید بری توی شبکه اجتماعی سرچ کنید معمولا اینا میاد. چرا؟ چون تو شبکههای اجتماعی همه سعی دارند زندگی رو خیلی خوب نشون بدن و بگن زندگی ما ایده آله و به همین دلیل بهترین جملاتی که در توصیف همسرشون، زندگیشون استفاده میکنند اینا هستند. جملات حالا توی رنکینگ میاد بالا که شوهر من زندگی من، شوهر من بهترینه، در صورتی که در زندگی دیگر سعی ندارند تصویر خوبی از همسرشون رسم کنند جوابهایی که میاد مثل همونایی هست که در اسلاید ۲۱ اومده. یا یک مسئله قشنگی داره که اجازه بدید من خیلی که توی متنش نرم به نظرم جالب بود و خیلی تامل برانگیزه و میترسم اینجا بد ارائه بدم چون وقتمون کوتاهه و در واقع داستان شبیه اون قانون مورفی میشه. مورفی میدونین چی میگه؟ میگه وقتی شما توی اتوبان میرید تو یکی از دو تا خط معمولا اون خطی که تو رفتی این خط کند روئه و همیشه حرصت میگیره عجب بدشانسم! توی اتوبان تو هر خطی بریم اون خط کندتر میره جلو یا مثلاً توی پمپ بنزین یا جای دیگه و مثال شبیه این اینه که شما توی فرودگاه هستید و من میتونم مثال فرودگاه رو به ایستگاه اتوبوس در ایران تغییر بدم. وقتی شما توی ایستگاه اتوبوس هستید هر اتوبوسی که میاد بیشتر در اون طرف متمایله. اون طرف که نمیخوای سوار بشی. اونی که تو منتظرشی کمتر از بقیه میاد. توی فرودگاهم اینجوریه میگه مثلاً اگه هتل شما سرویس داره هرچی صبر کنید میبینید بیشتر سرویس اون یکی هتل میاد، هرتز میاد مثلاً و این نه بدشانسیه نه خطای ذهنه بلکه یه مقوله آماری هست و مقوله آماری اینو میگه که اگر اینها به صورت مساوی اتوبوس داشته باشند و اینا رو به صورت تصادفی پخش کرده باشی در واقع اونایی که از جناح رقیب، از خط انتقال رقیب شما میبینید به طور متوسط دو برابر اونیه که در خط خودت میبینی. خوب دلیلم داره برای اینکه اونایی که مال خط خودتن سوار میشید میرید و سمپل شما حذف میشه. پس شما در نظر بگیرید وقتی سمپل، یعنی نمونه، یه بخشیش حذف میشه همبستگیها کامل به هم میریزه و اینجا اشاره داره که خیلی از موارد که قضاوتهای ما بر اساس سمپل یا نمونههای سوگیری شده است و میگه خیلی از یافتههای علمی زیر سوال و شبهه هست به این دلیل که این یافتهها از حجم نمونههایی استفاده کردند که بیان واقعیت جهان بیرون نیست بلکه سوگیری شده. بخشی از اون نمونه حذف شده و مثالهایی میزنه که چگونه این قضیه میتواند در نتایج آماری ما تاثیر داشته باشد. مثال قبلیشو دیدید اگر شما برید در گوگل نظرسنجی کنید میبینی حس میکنی که همه مردم از زندگی زناشوییشون ناراضین در صورتی که اگر بری شبکه اجتماعی مثل فیسبوک سرچ کنید میبینی همه آدما به نظر میاد که راضین یا لااقل دارن اینجوری نشون میدن. این مثال قشنگ دیگهای زده. من این مثالو در خطاهای شناختی ارائه دادم ولی اگه اجازه میدید یه دو سه دقیقهای هم اینجا مطرحش کنم. این میگه فکر کن از مردم بپرسید، اینو یک توضیح طبیعی جامعه در نظر بگیرید، یه مقدار مسائل رمانتیک یا عشقی دخیله و میپرسه که آیا اون انسانهایی که از جنس مخالف میبینی، راسته که میگن اونایی که خیلی هاتن، آدمای خیلی بد اخلاقین و اونا که خیلی نایسن یا آدمای دوست داشتنی و خیلی همچین مهربونن، قیافه ندارند؟ یعنی داستان اینه که آیا واقعاً راست میگن که آدمایی که گیره آدم میافتن یا خیلی خوشتیپ و خوش قواره و خوش قیافه هستن ولی اخلاق ندارن یا خیلی خوش اخلاقن ولی خوشتیپ نیستن و بین این دو تا یه رابطه معکوس است و میگه میشه آیا این را بررسی کرد یا نه. مثال قشنگی میزنه میگه فکر کن توزیع جامعه به این شکل باشه که این طرف شما محور هات بودن رو داری؛ اونایی که خیلی شیکن، خیلی جذابن و خیلی ظاهر زیبایی دارند و اونایی که از اینجا از اخلاق بد شروع میشه و تا اخلاق خیلی خوب میرن. ببین اینجوری شما نگاه کنید هیچ همبستگی وجود نداره و میگه شما معمولاً در نظر بگیر معمولاً شما اگر شروع میکنی برای یافتن شریک عاطفی عشقی رمانتیک، یه عده رو حذف میکنی و میگه خب ما تعارف نداریم دیگه یه عدهای که اون پایین هستند نه قیافه داره نه اخلاق داره شما اصلاً هیچ وقت باهاش معاشرت نمیکنی. حاضر نیستی باهاش یه قهوه خونه بری، یه کافه تریا بری، یعنی اون گروه رو نمیخوای. از اون طرفم یه عدهای هستند که میگه باز تعارف نداریم هر کسی دوست داشته باشی بعضیا انقدر استانداردشون بالاست که اونا شما رو نمیپذیرن و نمیخوان با شما معاشرت کنند و با شما با به date بیان و با شما قهوه خونه بیان، کافه تریا بیان در نتیجه این حد وسط می مونه. و شما وقتی این حد وسط رو نگاه میکنی یه ضریب همبستگی کاملا منفی، منفی۷۵ صدم پیدا میکنی بین هات بودن اونها و بین همچین جذاب بودن اونها و نایس بودنشون و خوب بودنشون. یعنی میگی والا ما هرکی میبینیم یا ظاهرش خوبه یا اخلاقش مثل اینکه این دوتا با هم جمع نمیشه. یعنی اونی که اخلاقش خوبه ظاهرش گنده و اونی که اخلاق بدی داره ظاهر خوبی داره. و درستم میگه و شما ببینید شما یک ضریب منفی ۷۵ صدم خواهید داشت در صورتی که این به روانشناسی انسانها برنمیگرده این به حجم نمونه شما برمیگرده. شمایی که یه عده رو قیچی کردی انداختی دور و یه عدهای که شما رو قیچی کردن انداختن دور. با شما حاضر نیستن معاشرت کنند. در نتیجه شما این حالت را خواهید دید. در واقع این یک تراژدی که شما کجا وایسادی و من قبلاً راجع به اینم صحبت کردم که شناخت ما، باورهای ما، گرایشهای ما، بیش از اون که پدیده ذاتی باشه، اینه که شما کجا وایستادی شما وقتی که طبقه متوسط هستی و فکر کن اون طبقه خیلی مرفه حذف کنی، و طبقه خیلی محروم رو هم از معاشرین خودت خط بزنی شما در بسیاری از صفتها یک ضریب همبستگی منفی خواهید دید. در صورتی که این ضریب همبستگی ذاتی نیست کاملاً ساختگیه. مثلا شما امکان داره بگی که والا ما هرچی آدم دیدیم که هرچی پولدارتر بودن خسیس تر هم بودن. هرچی آدم دست و دلباز دیدیم فقیر بودن. یا هرچی آدم تحصیل کرده دیدیم فقیر بودن. هرچه آدم بیسواد دیدیم پولدار بودن و اینکه شما این همبستگیهای منفیو در زندگیت میبینی و تعجب میکنی که چرا جهان این گونه هست و حواست باشه شاید حجم نمونه شما بیانگر کل جامعه نیست و اونایی که هر دو رو ندارن یا هر دو رو دارند توسط شما حذف شدند. خوب و اینم مثالهای قشنگی که زده بود. و باز مسئله دیگهای که مطرح کرده بود matheness بود. مثال دیگه که زده بود من راجع بهش صحبت کردم که میگه در بسیاری از علوم اومدن با نشون دادن فرمول ریاضی و ابداعهای ریاضی سعی میکنند در واقع مجابکنندگی بودنشون رو ببرن بالا و در واقع توی پی اسهای مجاب کننده یا حرفهای مفت مجاب کننده مثلاً شما میای راجع به خوشبختی، راجع به نمیدونم توان موفقیت، نمیدونم موفقیت عبارت است از آی کیو ضرب در شخصیت تقسیم بر تلاش به اضافه اعتماد به نفس منهای ناکامی، فرمول ارائه میکنی. بعد شما دوست داری این فرمولا رو حفظ کنی. حس میکنی تو این کتابا میرم میخونم و میفهمی پس راز من اینه. من عدد ناکامیم به این دلیل پایینه. مثلاً آی کیوم پایینه. نمیدونم ولی میگم صرفاً اینا برای فریب دادن شما هستند. یا باز میگه جالبه که همون مثالهایی که گفتم استفاده از تکنولوژیهای خیلی مدرن. یک مقولهای هست که مثلاً چینیها یک پژوهش را چاپ کردن تو سال ۲۰۱۸ که ماشینهای هوشمند، که در واقع کامپیوتر را طراحی کردند به اون هوش مصنوعی یاد دادن، که چهره مجرمین رو با چهره غیر خلافکاران رو میتونه تمایز بذاره و با ضریب موفقیت بالایی، نزدیک ۹۰ درصد با نگاه کردن به عکس پرسنلی یک نفر میتونه بگه که این آدم خلافکاره یا نه و من اینو جداگانه در اینستاگرام خدمت شما ارائه میدم و میگه که خیلی هم سر و صدا کرد ۲۰۱۶ و کلی آدم به این نقد نوشتند این مگه میشه آخه کامپیوتر این کارو کنه ولی در واقع ممکن بود که من به شما رازشون نگم، اسپویلر میشه. تو اینستاگرام برید ببینید. پس بحثهای قشنگی داره گفتم یه جای دیگش میاد میگه که خیلی از جاها همبستگیها را مقاله نشون میده ولی علیت به جای اون به شما غالب میشه. همبستگی یعنی این دوتا با هم دیده میشن ولی هیچ دلیلی نداره که این دلیل اون باشه یا اون دلیل این باشه یا امکان دارن هر دو معلول یک علل سوم باشند. میگم مثالهای قشنگی میزنه مثلاً یه مقالهای هست که ۲۰۱۸ چاپ شده. Never been kissed هیچ وقت نبوسیدنم. در واقع همبستگی اینه در دانشجویان دانشگاههای آمریکا، که هیچ موقع نبوسیدنت. چیزی که در آورده بود این بود که همبستگی وجود داره بین اعتماد به نفس و سن اولین بوسه و این مال خارجه. اینا رو در ایران در نظر نگیرید فقط میخوایم مقالهشو بگیم. از افراد پرسیدن اولین باری که جنس مخالفو بوسیدی کی بوده یا اون بوسیدت کی بود و دیده بودن این چه همبستگی بالایی با اعتماد به نفس داره و بعد به این نتیجه رسیده بودند که اعتماد به نفس شما باعث میشه شما زودتر بتونی در واقع جنس مخالف را ببوسی و مقاله اومده بود کلی نظریه داده بود و اینا که بین این دوتا ارتباط هست ولی این مقاله تنها چیزی که میگه یک همبستگی بین ایناست. شما میتونین اینطوری فکر کنید که انسانهایی که زودتر تونستن یکیو ببوسن، احساس کردن که من خیلی کار درستم و اعتماد به نفس بالاتر میتونم داشته باشم. یا شاید اصلا یک رابطه سوم وجود داره، روابط رمانتیک. انسانهایی که روابط رمانتیک دارند و عاشق میشن و احتمالاً زودتر امکان داره یکی رو ببوسن و اون آدم عاشق میتونه اعتماد به نفس بالاتر داشته باشه یا از اون طرف اعتماد به نفس بالاتر در دانش آموزان و دانشجویان باعث میشه که اینا زودتر وارد رابطه رمانتیک بشن و در نتیجه زودتر اولین بوسهشونو به دست میارن یا اینکه شما اولین بار یکیو ببوسی ممکنه زودتر وارد روابط رمانتیک بشی و اون رابطه رمانتیک به شما اعتماد به نفس بالاتر بده. پس ببینید کل حرفش اینه و اینا رو توی کتاب آمار میگن، میگن اون چیزی که توی نمودار به شما نشون میده صرفاً همبستگیه و این همبستگی هیچ علیتی رو نشون نمیده و صرفاً امکان داره علیت از یک فاکتور سوم باشه یا فاکتور چهارم، پنجم، ششم. مثلاً فکر کنید یه فاکتور دیگه پنهان است مثلاً وضع مالی خانوادگی. اونی که وضع مالی خانوادگی بهتری داره طبیعتاً اعتماد به نفس بالاتری داره. توی دانشکده زودتر عاشق میشه. یا ممکنه مثلاً به توان فیزیکی برگرده اونی که توان فیزیکی بالاتری داره در واقع هیکل بهتری داره اعتماد به نفسش بهتره و اعتماد به نفس بهترش باعث شده که زودتر بره و کسیو ببوسه. و این نشون میده که چقدر اینا میتونه توش سفسطه صورت بگیره منتها اینو میان تیتر میکنن. یعنی مقاله هم این ادعا رو نداره. مثلاً آقای رفلوبیکس این به اندازه کافی باهوش هست که نیاد نتیجهگیری کنه ولی این امکان داره این تیتر یک پیام در شبکه مجازی بشه که شمام بگی چه جالب. هم زود بیای لایکش کنی هم بیای فورواردش کنی و اشتراکگذاریش کنی، که مثلا آدمای اعتماد به نفس بالا بیشتر طرفو میبوسن. خبرنگار هر طوری که دلش بخواد میتونه اینو بنویسه که زودتر دیگرانو ببوسید تا اعتماد به نفستون بره بالا. یعنی شروع کنید در ۱۵ سالگی، ۱۴ سالگی، در ضمن میانگین سنی که درآورده بود ۱۵ و نیم سال بود. مثلاً اومده بود دیده بود اون دانشجویی که به بیست و سه/ چهار سالگی رسیده بود و هنوز هیچکی رو نبوسیده بود اون مشکلش چیه و در واقع بیای رو این نتیجهگیری کنی و بیای وارد اون صفحههای روانشناسی زرد بشی. در واقع این یکی از قسمتهایی که خیلی اونا رو به نقد میذاره و اونا رو حرف مفت تلقی میکنه که چگونه روانشناسی زرد از یافتههای پژوهشی با این لطایف الحیل استنتاج میکنه. میگه اعتماد به نفس سرمنشا بسیاری از موفقیتهاست. در صورتی که در واقع این یه مقاله تنها چیزی که نشون داده پرسشنامه اعتماد به نفس داده یکی هم گفته اولین سنی که یکیو بوسیدی چه سالی بوده و در نتیجه این دو تا با هم یک ضریب همبستگی دارند. ولی اون وسط یه حرف مفتی خلق میشه و بر اساس اون حرف مفت شما میبینی تعداد زیادی آدما میان نتیجهگیری میکنند. پس دوستان عزیز خیلی از این سخنرانیهای زردی که شما میبینید، مثلاً به خودت تلقین کن که موفق میشی و بعد مثلاً همسر ایدهآل پیدا میکنی، خوب اینا اومدن از روی یه مقاله که درواقع دزدی هم نیست استفاده کردن و آمارم ساختگی نیست، آمار واقعیه، مثلاً نشون داده آدمایی که به نفس خودشون خوب تلقین میکنند اینا معمولاً روابط زناشویی بهتری هم دارند ولی این ادعایی که این اون رو ایجاد کرده یا اون این رو ایجاد کرده، عناصر وسط دیگر در واقع خیلی از مواقع مورد غفلت قرار گرفته شده. میگم اینا در اولین جلسات روش تحقیق و آمار اینا رو به شما میگن ولی وقتی مثالهای بامزهاش را شما ندیده باشی، خواهی دید که چگونه ممکنه آدم گمراه بشه و خود شما فکر کنید که آره راست میگن، میگن بچه مدرسههایی که خیلی اعتمادبهنفس بالا دارند اینها مثلاً بیشتر میتونن با جنس مخالف رابطه عشقی برقرار کنند یا مثلاً آمار دیگهای که خیلی هم سروصدا کرد و اینا میگم استخراج مثالهاش قشنگه. بیشتر از جاهایی که خیلی viewer داشته، خیلی بازدیدکننده داشته، خیلی لایک داشته بوده. مثلاً پژوهشی اومده ادعا کرده بین سن مرگ موسیقیدانها و ژانر موسیقی که اینا کار میکنند یک ارتباط خیلی جدی هست. مثلاً اونایی که بلوز و جاز و کانتری کار میکردند یا کاسپین، سن متوسط مردنشون شصت و پنج سال بود چه زن چه مرد. تو این صفحه 31 شما میبینید. پاپ مثلاً اینجا بود ولی نگاه کنید راک میاد پایینتر و موسیقی پانک و از همه کمتر متال، رپ و هیپ هاپ بوده که میانگین سن مرگ افراد سی تا سی و پنج سال بوده. یعنی شما تقریباً نگاه کنید اگه این منحنی رو نگاه کنید این منحنی خیلی فراگیر شد. این یه نمونه دیگهاش رو هم تو سایتهای مختلف زدهاند. توی سایتهای روانشناسی از این استناد شده. توی روانشناسی زرد استفاده شده. که نوع موسیقیای که کار میکنی طول عمر تو رو نشون میده و درواقع اومدن دیدن که نگاه کن که موسیقیدانهای متال، رپ، هیپ هاپ چهقدر عمرشون کمه در مقایسه با موسیقیدانان بلوز جز، گاسبل و اینها. اینجور چیزام قدرت باز گردش دارند. یعنی هر کس اینا رو میبینه زود برای یکی دیگه میفرسته که وای چه پژوهش جالبی اگه هیپ پاپ کار کنی، نصف اونایی که جز کار میکنن عمر خواهی کرد. درصورتیکه وقتی نگاه میکنی اینم همون زامبی استیتکسه. مثلاً ایراد توش خیلی زیاده. مثلاً ایرادی که توی این منحنی پیدا کردن اینه که خیلی خوب، این سه موسیقی، موسیقیهای جدیدتره. در نتیجه افراد زیادی توی این موسیقی هستند که هنوز زندهاند و دارند این موسیقی رو دنبال میکنند. این آمار بهشتزهرا شونه، این آمار مرگومیرشونه، که آره وقتی یک چیز جدید باشه مثلاً شما فرض کن میانگین سنی افرادی که اون موسیقی رو دارن کار میکنن سی تا سی و پنج سال باشه، پنج نفرشون هم بمیره، میانگین سنی مرگومیر میشه همون سی/ سی و پنج سال و پا به سن که گذاشتن کمکم اینم میاد بالا و حالا نمیخوایم از هیپ هاپ و رپ و متال دفاع کنیم ولی میخوام بگم که این آمار، آمار فریبنده است. مصداق درواقع فریب دادن طرف با یکسری آماره و بعد از روی این میان نمیدونم کلی نظریات به قول خودش bull shit میسازند که آره هیپ هاپ ذهن رو اینجوری میکنه، ما رو اینجوری میکنه، بعد شما این میشی، این شخصیت هستید و باعث مرگ زودرس میشه و سیستم کرتیکواستروئید رو فعال میکنه. میگه درصورتیکه کل این توضیحات که پشتش اومده BSئه. شما آمار پایهات ایراد داره. شما باید این آمارو اصلاح کنید که از این تعداد که شما فوتی داشتید خب اینا فوتی ان دیگه و این آمارشونه. باید ببینی چند نفر هنوز زنده ان و بعد یه تحلیلی بکنید که اونا کی خواهند مرد. یعنی درواقع دیتایی که شما داری فقط مردهها نیست زنده ها رو هم باید کنارش داشته باشید. پس یکی از چیزای مهمی که او درواقع مرتب یادآوری میکنه اینه که چگونه افراد میتوانند با جعل آمار یا حتی وارونه نشاندادن آمار شما رو فریب بدن. مثال دیگه: ارتباط سرطان تیروئید با گلای فوسید که درواقع یک ماده شیمیاییه که ارتباط داره، ببینید چقدر دقیق منطبق هست بر تعداد موارد سرطان تیروئید. درصورتیکه شما وقتی منحنی رو نگاه میکنی متوجه میشی که منحنی رو جعل کردن، یعنی جعل نیست، این واقعیه و یه جور بد به شما نشون دادن. اینجا رو نیومده تعداد موارد سرطان را صفر بگیره، بلکه اومده چهار گرفته یعنی اگر در واقع این منحنی رو میکشید پایین شما ارتباط را به گونهای دیگه میدیدی و در واقع اینجا نگاه کن یه جایی هست که به صفر میرسه و زیر صفر هم میتونه بره پس درواقع منحنی رو بد انطباق کردند یعنی با تغییر دادن مقیاس دو طرف و نقطه صفر دو طرف این منحنیها رو روی هم منطبق کردند. یعنی گاهی اوقات افراد برایاینکه اون دستور کار خودشونو دنبال کنن این شیطنتها رو مرتکب میشن. یا مثلاً مثال دیگه: مثلاً نگاه کنید میگه که طرف ممکنه تیتر بسازه که سهام شرکت فیسبوک سقوط جدی کرد و شما اینجا نگاه میکنید این منحنی رو نشون شما میدن که بهخاطر این سیاست یا بهخاطر این رفتار این اتفاق افتاد و شما در اسلاید سی و چهار میبینید منحنی اینجوری بوده بعد یه دفعه چه افتی کرده و در صورتی که اگر اصل منحنی رو به شما نشون بدن اینه. بقیه منحنی رو نگاه کنی دیگه اون حس رو نداری که این سهام چرا افتاده. میگیم که این جزو نوسانات طبیعیش بوده. یعنی چگونه با دستکاری کردن مقیاس و طرز نشون دادن میتونن شما رو فریب بدن. یا مثلا این یکی رو نگاه کنید. این رو طرفداران عدم گرمایش زمین، اونایی که معتقدند تولید دیاکسید کربن خیلی نقش نداشته و سوختهای فسیلی خیلی نقش نداشته، دارند به شما نشون میدن و میگن نگاه کن درواقع زمین گرم شده و اومده بالا، ولی چند سال اخیر دیگه که گرم نشده میبینی از دوهزار و یک تا دوهزار و شونزده خیلی فرق نکرده. شما اینجا رو نگاه میکنید و می بینید اینجا خیلی رفته بالا. پس این فاجعه هرچه بود مثل اینکه داره کنترل میشه. ولی شما که این پایین رو نگاه کنید متوجه میشید که مقیاس این پایین رو، سی سال، سی سال رسم کرده و اینجا اومد یکسال، یکسال رسم کرده. یعنی شما اگه این منحنی رو نشون یکی بدی و به اصطلاح بگه که دوستان عزیز ببینید توی کره زمین داشته تولید دیاکسیدکربن زیاد میشده ولی خوشبختانه تونستیم کنترلش کنیم. ببینید این سالها خیلی رفته بالا؛ از 1901 که خودرو اختراع شد خیلی رفته بالا و در صورتی که این مقیاسها و پایینش حواستون باشه میبینیم مقیاس رو متناسب انتخاب نکرد. اگه متناسب انتخابش بکنند این شکلی میشه. یعنی بیان این پایین این کار را نکنند که اینجا سی سال، سی سال نشون داده و بعد یه سال یه سال. اگه همهاش رو بیان یه جور نشون بدن میبینی که هیچ کند شدنی درکار نیست و مرتب داره رو به بالا میره. پس ببینید با یک گراف شما ممکنه رودست بخوری و ادعایی که الان مطرحه توسط دانشمندان اینه، همون حرف گری کاسپاروف که میگه اینقدر شما بمباران میشی که مثلاً یک کسی همین رو درست میکنه، میذاره توی تلگرام، میذاره تو اینستا و زیرش مینویسه فریب کربن دی اکسید و شماهام دیگه فرصت نداری خیلی آنالیزش کنی. بعد نتیجهگیری میکنیم که داستان سروصدای بیخود بوده و بسیاری از این چیزهایی که در واقع شما میبینید در شبکههای اجتماعی، در خیلی از این صفحهها حتی اونایی که خیلی هم زرد نیستند خبرگزاریهایی مربوط میببینید که چگونه دستکاری شده. مثال دیگهای میزنه صفحه 38 که من این اسلاید رو از کتاب انتخاب کردم؛ ببینید صحبت سر اینه که پولدارها تو آمریکا بیشتر مالیات میدن یا فقرا. یه بحثیه که الانم فکر کنم این مناظرههای انتخاباتی و اینا خیلی هست و اینجا اومده میزان مالیات دادن را مشخص کرده به تریلیون دلار و اینجا میزان درآمد دهکها یا صدکهای مختلف جامعه رو نشون داده. ببین هر سهتای این منحنی یکیه. یعنی براساس یه آمار ساختهشده. هر سه تای این نمودارها. منتها آنچه که این پایین هست، این دستهبندی این واحدها است. اینجا اومد گفت اونایی که درآمدشون بین صفر دلار تا صد هزار دلار در ساله، اونا که درآمدشون صد هزار دلار تا دویست هزار دلار در ساله، اونایی که دویست هزار دلار تا پونزده هزار دلار در ساله و اونایی که بالای ده میلیون دلار است و در واقع اگر منحنی رو اینجوری رسم کنی طرف یه نگاه میندازه میگه مثل اینکه هرچی فقیرتر میشیم بیشتر مالیات میدیم. این چه جامعهایه؟ از فقرا مالیات میگیرن و مثل همون جامعه اون جنگل شرووده که رابین هود قیام کرده و داروغهی ناتینگهام که از فقرا مالیات میگیرید و پولدارا اونقدر مالیات نمیدن. درصورتیکه بیایید دهکبندیها رو یه جور دیگه کنی. مثلاً بیای اینجا بگی صفر تا بیست و پنج هزار، بیست و هشت و صد هزار، این منحنی عوض میشه و شما این حس رو خواهی داشت که طبقه متوسط داره مالیات میده و باز براساس همون دادهها بیای اینجوری دهک دهکشون کنید یا دستهبندی شون کنید: هزار تا پنج هزار، پنج هزار تا دههزار، دههزار تا پنجاه هزار و بعد آخر سر بیای بگی بالای دویست هزار. شما کاملاً حس میکنی که پولدارها دارند در آمریکا مالیات میدهند. یعنی ببینید چقدر راحت میتونن بدون اینکه داده رو درش تقلب کرده باشند صرفاً از طریق بازنمایی اون، شما رو فریب بدن. درنتیجه اونی که در جامعه آمریکا یه مقدار رویکرد سوسیالیستی و چپ داره، نمودارشو اینجوری رسم میکنه و میگه ببین فقرا دارند مالیات میدن و این چه جامعه ای هستش و از اون طرفم اون جمهوریخواهها و راستیها احتمالا خواهند گفت نخیر اتفاقا پولدارا هستن که دارن مالیات میدن. این طبقات فقیر ببین اصن مگه چقدر مالیات میدهند؟ درصورتیکه شما از طریق خوشهسازیها میتونی اون رو تغییر بدی. یا این مورد علاقهی منه. میگه که شما میتونید همین کار رو راجعبه ژنتیک و هوش یا دستاورد تحصیلی بکنید. ببین منحنی رو اینجوری میتونی رسم کنی که بیای دهدرصد، ده درصد رو با هم دستهبندی بکنی. یعنی ده تا دهک درست کنی از نمرات آزمونهای جی دبلیو اس ژنتیک و اون ژنوم استادی و اینم نمره هوش افراد یا دستاورد تحصیلی که اینرو معادل نمره هوش میگیرند یعنی هشت کلاس، نه کلاس درس خوندن و درواقع میگه که اگر ما ده گروه یا ده دهک در واقع از تغییرات ژنتیکی ببینیم شما واضح میبینی که ژنتیک چقدر نقش داره و اونی که درواقع از اون در اون شاخصها در اون دهک آخر هست عملاً دو کلاس بیشتر درس خواهد خوند. یعنی واقعاً شما با این نگاه کردن به این منحنی اینگونه نتیجه میگیری که هرچقدر شاخص هوش عوض میشه میزان تحصیلاتم میره بالا پس مقدار زیادی از تحصیلات و هوش ما ژنتیکی است. درصورتیکه این بهدلیل اصطلاحاً دستهبندی اینجوری شده. اینا اومدن فرض کن بین سی تا چهل درصدو با همدیگه یه دسته کردن، میانگینشو رسم کردن. همین رو میشه اینجوری رسم کرد. این همون آماره. شما دیگه اونقدر پررنگ نمیبینیش. یعنی شما وقتی اون رو میان درواقع دستهبندی میکنن شما به ذهنت میاد که واضحه دیگه هرچی ژنتیک تغییر میکنه درسم میره بالا. ولی اینجا شما دیگه اون واضح بودنو نمیبینید. یک گرایش میبینی ولی یه جور دیگه اون مجابکنندگی قبلی رو تو ذهن شما نداره. حتی خیلیها اذعان کردن که نه بهنظرم خیلی فرق نکرده که این اینجاست و میدونم اونجاست. اینه که منهای دو ده نمره ژنتیک داره دقیقاً همون آورده که با این آورده یعنی میبینیم طرز نشون دادن درواقع دادهها میتونه بر میزان مجاب شدن شما اثر بگذارد یا مثلاً ده کتاب شایعی که در دنیا خوانده میشود و شایعترین کتاب در کشورهای انگلیسیزبان؛ انجیل هست و بعد شما میای هری پاتر رو داری، ارباب حلقه ها رو داری، داوینچی کد رو داری بر باد رفته رو داری و خاطرات آنا فرانک رو داری. حالا من مثال زدم و چند تا رو ولی شما نگاه کن با یک ظرافتی شما رو گول زدن شما حس میکنید که بین آنا فرانک و بربادرفته و داوینچی کد خیلی فاصله نیست و بیشترین فاصله جدی رو با انجیل مقدس دارید درصورتیکه شما نگاه کنه خب اینجا نقطه صفر اینجاست و این پایین برای فریب چشم اینجوری رسم شده شما این زیر رو نبینی واقعاً حس میکنی که تفاوت خیلی بیشتر است. یعنی طرز بازنمایی درواقع نمودارها میتونه گول زننده باشه. باز این نمودارهایی که حتی توی cia fact book چاپ شده که دربارهی مثلاً میزان زمینهای قابل کشت کشورهای مختلف است. خوب شما اگر نگاه کنید به ازای سرانه و هکتار بهظاهر میاد که خب این یک نمودار منطقی هست ولی نمودار ایراد جدی داره برای اینکه فرض کنید اونی که اینجا هست شما که منحنی خیلی کوتاه میبینی ازش درصورتیکه معادل این اینقدر نیست معادلش اینقدره و چون اینایی که به مرکز نزدیکترند خیلی تو چشم بهنظر میآد که ضعیف تر هستند درصورتیکه اونی که از مرکز دوره چون درواقع دایره بزرگتری رو رسم خواهد کرد، بهنظر شما میاد که خیلی فاصله زیاده. حالا معلوم نیست این به قصد فریب افراد اینجوری رسم شده یا اینکه اون کس که داشته این نمودار رو تهیه میکرد و حواسش به این ظرافت نبوده. یا مثال دیگه میزنه. اینم جالبه که راجع به میزان مرگومیر تصادفات در تصادفات رانندگی باتوجه به سن هستش. خب شما اگر این نمودار رو نگاه کنی میگم زامبی استیسکس که میگم اینه دوستان و این کتاب میگم چیزایی که داریم که خیلی بدیهیه کسی که الان مخاطب هست و ممکنه این فایل رو گوش میدی میگی من تحصیلات دانشگاهی دارم و همینا رو تو آمار خوندم که باید مشخص بشه اون نمونه گیری از چه جمعیتی بود و جمعیت چقدر بود چند درصد رو تشکیل میده و وقتی توی رسانههای زرد مطرح میشه شما رو فریب میده. مثلاً شما همین رو نگاه کنید این دوره میگه تعداد موارد فوت بر اثر رانندگی در آمریکا در سال 1388براساس سن: شونزده تا نوزدهساله، بیست تا بیست و چهار ساله، همینجور میره تا بیست و پنج ساله و بالا. خوب این منحنی رو شما نگاه کنید حس میکنید اینو یه جا براتون چاپ کنند که جوونها تو تصادفها خیلی بیشتر کشته میشند مثلاً هشت هزار نفر، هشت هزار و خوردهای نفر، بیست تا بیست چهار سال کشته میشه درصورتیکه هفتاد تا هفتاد و چهار ساله خیلی کمتر کشته میشه هزار نفر و با یه نگاه سریع شما این حسو میکنی که جوونا تند میرونن و اصلاً رعایت نمیکنند. اصلا تمام مشکل ما، بدبختی ما از همین جووناست و زود هم طرف میگه جوونا احساسی هستن، جوان کنترل تکانه ندارد، جوونهای جدید این جورین دیگه، بیمبالاتن. گاز میده آدم رو زیر میگیره و اینم منحنی و اینم علم دیگه چی از این نمودار بهتر. درصورتیکه این نمودار رو باید یه جور اصلاحش کرد مثلاً میگه تعداد مرگومیر با توجه به سن در مقیاس مقدار رانندگی. حالا اینا که شما نگاه کنید میگید این سالمندان چقد خطرناکن! یعنی فرق این اسلاید اینه که در اینجا این را لحاظ نکرده که یک هفتاد و پنج ساله در طی یکسال چند کیلومتر چند مایل رانندگی میکنه. خب وقتی شما مقدار رانندگیت خیلی کمتره طبعاً تعداد تصادفاتتم کمتره. اگر بیای با اون استانداردش کنی، منحنی ببین کاملاً برعکس میشه. یعنی شما هر چی سن میره بالا طرف البته شونزده تا نوزده سالهها کماکان همون مقدار رو خواهند داشت یعنی شما اینجا یک اعاده حیثیتی میشه در این نمودار از افراد بیست تا مثلاً سی و پنج سال یعنی شما متوجه میشوید که منحنی رو نگاه کنین اتفاقا شاید بیست و پنج سالهها تا سی سالهها و سی و پنج سالهها خیلی آدمهایه محتاطی هستند چون با توجه به اون مایلِج و اون مقدار رانندگی براساس کیلومتر که انجام میدهند تعداد موارد فوتیشون خیلی کمتره و سالمندان دوباره خطرناک میشن و خیلی خطرناکتر میشن یعنی بین دو منحنی براساس یک نوع داده با بازنمایی متفاوت میتونه نتیجه رو برعکس کنه. اینجا یک کسی که ضد سالمندان باشه و سیاستهای محدودکننده سالمندان داشته باشه میتونه منحنی رو اینجوری رسم کنه و اون کسی که میخواد جوان ستیزی کنه منحنی رو اینجور رسم کنه و شما میبینید چقدر راحت می تونید گول بخورید یا باز بازنمایی متفاوت اینجا اومده گفته که خب تعداد افرادی که توی ایالت اونتاریو به حزب لیبرال یا حزب ان دی پی و اینا رأی دادن. خطاش چیه؟ خطاش اینه که ان دی پی اینجا سی و پنج درصده درصورتیکه اونتاریو پیسی اینجا چهل درصده ولی این رو چون جلو گذاشته و پرسپکتیو هست شما حس میکنید که این خیلی قویتر از اونه و در واقع اگر این اعداد روش رو ننویسه شما میگی این جلوئه دیگه و این همه رو گرفته در صورتی که این خب بهخاطر اختلاف دید شماست. در این راه یعنی میگم کتاب متنوع هست از درواقع کلکهایی که میشه زد و درعینحال هیچ دروغی هم نیست و طرف میگه دروغ نگفتم اینا ولی حواسمون باید باشه که منحنیهای پایه سهبعدی از جلو اینجوری دیده میشن که درواقع سهم اونی که جلو هست بهصورت کاذب خیلی پررنگ دیده خواهد شد. یا چند مطالعه دیگه هستند که اینم شبیه اون مطالعاتی هست که ما توی اون تشخیص مجرمین از افراد غیر خلافکار دیدیم. مثلاً اومده بودند دیده بودند که آیا سیستم هوش مصنوعی میتونه پنومونی رو تشخیص بده و دیده بودند که آره سیستم هوش مصنوعی کامپیوتر یاد گرفت که تصاویر پنومونی رو خیلی راحت جدا بکنه از تصاویر غیره پنومونی ولی مثلاً میگم همیشه ظرافتهایی هست که مورد غفلت قرار میگیره مثلا سنجیده بودند که هوش مصنوعی در بسیاری از موارد و برخی مقالات از روی نمای روی یک اینکارو نمیکنه از روی این نمای جانبی که مثلاً این تگی که اینجا گذاشته و مثلاً مربوط به اورژانس بوده این کار رو میکنه و توی اورژانس معمولاً مریضا بدحال ترن و تگشون هم فرق میکنه و درواقع کامپیوتر از روی ریه نمیگفته که این پنومونی داره از روی اینه که این عکس تو اورژانس گرفته شد میفهمیده که این پنومونی داره چون موارد پنومونی توی اورژانس بیشتر بوده. میگم اینا همش خطاهاییه که خیلی فراگیر میشه و بعد میان اصلاحش میکنن. مثلاً یکی نرمافزاری اختراع کرده بود که میگفت سگ هاسکی را از وولف، از گرگ خیلیخوب تمایز میده این نرمافزار هوشمند ولی بعداً دیدن که نخیر نرمافزار هاسکی را از گرگ تمایز نمیده از پس زمینه تمایز میده. هاسکی ها معمولاً توی دشت و بیابان نیست عکساشون ولی گرگها توی دشت و بیابان و برف عکساشون هست و درواقع دیده بودند که چهره هاسکی نیست که نرمافزار اون رو متمایز میکنه، پسزمینه هاست و درواقع چهرهاش رو هم دربیارن بازم میگفت عکس مربوط به هاسکی هاست یا باز مثال دیگهای هست که یه مقدار این فایل طولانی شد و من یه مقدار مجبورم سریعتر خدمتتون توضیح بدم این رو من جایی دیگه بحث جدی خواهند کرد راجع بش. اونم اینه که در خیلی از موارد دادهها تقلبی نیستند دوستان فقط همون جور که من راجعبه اون مثال چهره جذاب و اخلاق خوب گفتم بخشی از داده منتشر میشه. این یکی از بلیههای جدی علم معاصره. یعنی در واقع این علم همهی واقعیت رو به شما نمیگه و وقتی همه واقعیت منتشر نمیشه شما شاهد یک سوگیری هستی و نویسندههای مقاله مدعی هستند که یکی از شایعترین راههای ایجاد بول شت BS در جهان معاصر اینیه که برخی از قسمتهای دادهها داده نمیشه و اونایی که سوگیری خاص داره منتشر میشه. مثالی که میزنه از مقاله مشهوری هست نیوانگلند ژورنال مدیسون چاپشده و درواقع 2008 سروصدایی به پا کرد او گفته بود که نگاه کن مثلاً اومده و تعدادی از داروهای ضدافسردگی رو بررسی کرده بود که هفتاد و چهار مطالعه روشون صورتگرفته بود. این نمایی که شما در بالای صفحه میبینید اون چیزایی که تو ژورنال چاپ شد و توی ژورنال ببینید بهغیر از سه مورد بقیهی اونایی که چاپ شدن همه اثربخشیه مثبت داشتهاند درصورتیکه وقتی رفت اسناد افدیای رو نگاه کرده ببینید خیلی فرق داره. یعنی از اون هفتاد و چهار تا فقط سهتا از منفیها چاپ شده درصورتیکه در واقعیت تعداد بسیار زیادی منفی وجود داشته به این میگن سندروم کشوی میز و ادعاش بر اینه که یکی از مشکلاتی که علم معاصر داره اینه. اون یافتههایی که توشون جواب میگیری توشون مدنظر پژوهشگر هست به مطبوعات و ژورنالها راه پیدا میکنه. اونایی که جواب نمیگیری یا در واقع خود پژوهشگر منصرف میشه که خب مثلاً جواب منفی گرفتم چیه بفرستم چاپ بشه یا اینکه سردبیر ژورنال حس خواهد کرد که خب این دیگه ارزش نداره شما بین این مسئله و مسئله دیگه همبستگی پیدا نکردی خب که چی؟ در نتیجه اون رو میذاره کنار و چاپش نمیکنی ولی اون که همبستگی پیدا کرده باعث چاپ شدنش میشه. این پدیده یکی از سوگیریهای متأسفانه مشکلساز را در مطالعات نشون میده. اینم باز به همون مقاله برمیگرده یعنی شما وقتی نگاه میکنید اونایی که منفی بود هیچ کدومشون چاپنشده حالا چرا چاپنشده شاید سردبیر دوست نداشته یا خود نویسنده دوست نداشته و وقتی اون چاپ نشدهها رو بیان با چاپشدهها مخلوط کنن میبینید جوابها خیلی متفاوت خواهد بود. بازم میگم این رو من بهعنوان یک پژوهش تأملبرانگیز در فرصتی جداگانه بیشتر خدمتتون ارائه خواهم داد ولی در واقع صحبت اساسی این نوع مقالات اینه که بایستی سیستم علمی و کمکم داره این مد میشه که اون پژوهشهایی رو کردی و جواب نگرفتی هم اونها رو هم اگه راست میگی بیار و درواقع منتشر کن وقتی اون کار رو میکنی یه دفعه شما میبینید اثربخشی خیلی از مداخلات یک تفاوت محسوس میکنه. مثلاً از نمره کوهن نیم به دو دهم کاهش پیدا میکنه. که شما میبینیم منحنی خیلی جابهجا میشه و در واقع مدعی هستند که بخشی از این قضیه برمیگرده به مقوله چاپ شدن انتخابی دادهها و روشهای الان که داره راه میافته درواقع این شبهه رو ایجاد کرده که خیلی از مطالعاتی که ما الان داریم میبینیم همبستگی بین a و bپیدا شد این همبستگی جدی نیست بر اینکه معادلاین مقالات زیادی بود که این همبستگی رو نشون ندادن ولی خب سردبیر از چاپ کردن اونها امتناع کرد. خب فک کنم دیگه خیلی فایل طولانی شد من دوست داشتم تو همین جا جمعش کنم ولی اجازه بدید فایل رو متوقف کنم که چند دقیقهای از بحث مونده رو در فایل بعدی خدمتتون ارائه خواهم داد.