خب اگر موافق باشید یک پژوهش تاملبرانگیز دیگه رو با هم مرور کنیم، اینم از اون پژوهشهایی بود که در واقع دو سه چهار سال اخیر خیلی جنجال و سروصدا به پا کرد و خیلی در رسانههای عمومی و حتی مطبوعاتی که برای مخاطب عام بود، نتایجش منعکس شد و خیلی مناقشه برانگیز شد. اسم پژوهش بود automated inference on criminality using face images که مربوط به سال دو هزار و شونزده هست و محققین اون دو نفر بودند که چینی هستند وو و ژانگ، اما این پژوهش راجع به چی بود و چه نتایجی در بر داشت؟ چندین قرن هست که بشر در این فکره که آیا مجرمین، اونهایی که رفتارهای مجرمانه دارند آیا سیمای خاصی دارند؟ آیا جنایتکاران، افراد خلافکار، افراد ضد اجتماعی، افرادی که جرم مرتکب میشن، آیا میتوان اونها را از روی چهرهشان شناخت و در واقع افراد درستکار در مقابل افراد نابکار آیا تفاوتهایی در چهرهشون وجود داره یا نه؟ خب از دیرباز شایعاتی بود ادعاهایی بود ولی یکی از منسجمترین و میشه گفت جدیترین تلاشها برای طبقهبندی انسانها بر اساس چهرهشون توسط Cesare Lombroso جرمشناس مشهور ایتالیایی صورت گرفت و او کتابی داره که بعدا در سال هزار و هشتصد و هفتاد و شیش چاپ شده، ولی بعدا مجلدات دیگهای بهش اضافه میشه و میشه گفت یه بخش عمدهای از عمر لومبروزو رو به خودش اختصاص میده به نام legoe mo delinquent یعنی انسان خلافکار، انسان مجرم. و در جریان این کتاب او سعی داره چهرهی افراد رو بر اساس جرمهایی که مرتکب میشن و خلافهایی که مرتکب میشن ترسیم کنه و برای خودش یک طبقهبندی علم میکنه که مثلا این حالت پیشانی، این حالت گونه یا این حالت در واقع چانه بیشتر موید جرمهای خاصی هست و علمی رو پایهگذاری میکنه که بر اساس اون سعی کنن افراد مجرم رو شناسایی و دستگیر کنن اما این علم ره به جایی نمیبره و تحقیقات بعدی که نزدیکیای اواخر عمر لومبروزو صورت میگیره علم او رو نقش بر آب میکنه و ادعا صورت میگیره که از روی چهره نمیتونی در واقع نیات، شخصیت و در عین حال رفتارهای مجرمانه را در افراد شناسایی کنی اما مقالهی حاضر چی هست؟ مقالهی حاضر تقریبا یه چیزی حدود صد سال بعد از اون رد شدن ادعاهای لومبروزو یک بار دیگه سعی میکنه که این پدیده رو آزمایش کنه و این رو چینیها انجام دادن بر روی هزار و هشتصد و پنجاه و شیش چهره. این هزار و هشتصد و پنجاه و شیش چهره هزار و صد و بیست و شیش تای اونها غیر مجرم بودن و در واقع چهره رو از کارت شناسایی کارت ملی اونها به قول معروف یا گواهینامهی اونها یا جاهای دیگه استخراج کرده بودند و هفتصد و سی مورد دیگه هم داشتیم که اینها مجرمین بودند که باز چهرهی اونها رو از در واقع کارتهای شناسایی و کارت در واقع هویت اونها استخراج شده، منتهی در نظر بگیرید که ادعایی که نویسندههای مقاله کردن اینه که این چهرهها به عنوان مجرمین مربوط به تصاویری که دادگستری و زندانها و اینا گرفته نیست، یعنی اون اصطلاحی که خارجیها دارند میگن ماگ شات، اونی که یه دونه در واقع پلاک میندازن گردنش، لباس راه راه میپوشن مربوط به اون نبوده، از کارتهای شناساییشون گرفته شده و البته در مورد این هزار و صد و بیست و شش تایی که در مورد غیر مجرمین بود علاوه بر کارتهای شناساییشون از صفحههای رسمی و homepage اداری و در واقع شغلی اونها هم استفاده شده بود یعنی مثلا فرض کنید کارمند شرکتی بوده این کارمند عکس خودش رو به صورت پرسنلی نه عکسهای تفریحی و خانوادگی و اینا در اون سایت گذاشته و اینا استخراج کرده بودند همه مرد بودن همه نژاد چینی بودند سنشون بین هیجده تا پنجاه و پنج سال بود، عکس همهش در قطع پرسنلی بود و هنگامی که خواستند این پژوهش رو انجام بدن اون در واقع جوانب عکس رو ویراستاری کرده بودند یعنی هیچکس فرض کنید عینک یا مو یا لباس مشخص نبود فقط یک چهره رو بریده بودن و خارج کرده بودن، منتهی کاری که کرده بودند این بود که نه به داورها محولش کنند بلکه به هوش مصنوعی محول کنند و یک نوع machine learning رو توی اون اعمال کرده بودند، از چهار روش مختلف یادگیری هوشمند برای طبقهبندی تصاویر استفاده کردند اینجا من اینا رو عینا از مقاله استخراج کردم، خدمتتون میگم، راستشو بخواین اعتراف کنم من چیز زیادی در این مورد نمیدونم فقط دارم گزارش اونا رو میگم از روشهای logistic regression، k nearest neighbor یعنی KNN، support vector machine، یا SVM، conventional neural network یا CNN استفاده کردن، ظاهرا اینها روشها یا میشه گفت الگوهاییست که در اون به کار میبرند، تصاویر افراد مجرم و غیر مجرم رو به یک کامپیوتر نشون میدن و بعد مشخص میکنن و بعد اجازه میدن که بعد از اینکه هر کدوم از اینها رو لیبل زدن و گفتن که کدوم به کدومه اون الگوریتم یا اون در واقع روشی رو که ماشین استخراج میکنه برای سنجش بقیهی تصاویر به کار میبرن و در واقع به کمک این سعی میکنن ببینن آیا ماشین میتونه یاد بگیره شرایطی رو از این تصاویر استخراج بکنه، بر اساس این چهار روش مختلف، که بتونه به طرز معنی داری تمایز قائل بشه بین چهرهی مجرمین با چهرهی افراد عادی. خب نتایجش توی این نمودار هست یعنی شاید همین نمودار لب کلام رو ارائه میده چهار روش مختلف رو میبینید همون طور که میبینید در واقع روش CNN از همه در واقع موثرتر و قاطعتر بوده و چیزی که نتیجه نهایی این مقاله بود، اینه که هشتاد و نه ممیز نیم درصد یعنی هشتاد و نه و نیم درصد به کمک روش CNN میتونستن با دقت هشتاد و نه و نیم درصد تصاویر مجرمین رو از غیر مجرمین جدا بکنن، یعنی کامپیوتر یاد گرفته بود که این کار رو بکنه البته شما میبینید روشهای دیگه دقتشون یه مختصری کمتر میشه، SVM، KNN، و LR و اگر همهی اینها رو تلفیق کنیم اینا ادعا میکردند بالای نود درصد میتونیم چهرهی این افراد رو از هم تمایز بدیم. خب میتونید حدس بزنید که این چه بمب خبریای بود و به خصوص این که یه تعدادی از دانشمندان هوش مصنوعی اومدن یافتههای اونا رو تکرار کردن و به همین نتایج رسیدن. یعنی به نظر میاد که سیستم هوش مصنوعی میتونه از طریق عکس پرسنلی با یک دقت نسبتا معقولی نزدیک نود درصد دقت به شما بگه که این فرد خلافکاره یا آدم خوبیه و این مقاله سریعا انعکاس پیدا کرد به رسانههای عمومی، حالا اگر شما تو گوگل یک سرچ ساده بکنید و اسم نویسندهها رو بزنید یا در واقع تشخیص چهره بر اساس machine learning هوش مصنوعی بزنید چهرهی مجرمین بر اساس هوش مصنوعی بزنید تصاویر این مقاله و اسم این نویسندهها سریع میاد بالا. و اونا چه چیزایی رو یافت کرده بودن، یعنی بعدا که اومدن تحلیل کردن ببینن که اون ماشین از چه طریقی در واقع به تمایز چهرهی مجرمین از غیر مجرمین میپردازه و اون بزرگترین مولفههایی که اینها رو از هم تمایز میدن چیا هست؟ خب یکیش این زاویهی درواقع تتاست، زاویهای هست که اگر شما دو نقطهی در واقع لبها رو به نوک بینی وصل کنید یه زاویه به دست میاد، که این در مجرمین با افراد غیر مجرم تفاوت معنیداری داشت، همچنین این در واقع خط رو هست، این پی نیست رو یونانیه، که در واقع هر چقدر این انحنا رو به بالاتر داره افراد سابقهی غیر مجرمیت دارند و هر چقدر مستقیمتره، فرد مجرمتره، و درواقع سومین یافتهای که داشتند این فاصلهی دی بود که فاصلهی دو تا قسمت درونی پلکها هست، و هر کدوم از اینها تفاوتهاش رو شما، تفاوت میانگینهاشو در میان غیر مجرمین و مجرمین میبینید و همونطور که میبینید این زاویهی تتا خیلی به نظر میاد تعیین کنندهست یه تفاوت محسوسی داره، در غیر مجرمین اون زاویه خیلی بازه در صورتیکه در مجرمین این زاویه بسته تره و در عین حال این خط در واقع رو هست که اونم باز یک تفاوت ملموسی داره، هر چقدر در افراد غیرمجرمتر باشن این شیب بیشتر یا شکم بیشتری به سمت بینی نشون میده و فاصلهی دی هم که در مقام سوم قرار داره و حتی برای این که تکمیل کرده باشند پژوهشهاشون رو اومدن این کار رو کردن که اینها تصاویر تمام افرادی را که مجرم بودند با تمام افرادی را که غیر مجرم بودن روی هم مرف کردن یعنی روی هم قرار دادن و میانگین کلی گرفتن یعنی اون هزار و دویست نفر رو یه میانگین ازش درست کردن و از اون هفتصد و خردهای نفر هم یه میانگین، این میانگین مجرمین هست که بر اساس الگوریتمهای مختلف تقسیم شده و اینم میانگین چهرهی غیرمجرمان هست که کامپیوتر هم به خوبی میتونه این دوتا رو از هم تمایز بده، یعنی در واقع اگر شما نگاه کنید انسانهای خوب رو جمع بکنید لااقل نژاد چینی مرد و اونها رو، رو هم رو هم عکسهاشونو بذارید همچین تصویری به دست میاد و انسانهای نابکار، خلافکار، مجرمین، سارقین، اینم بگم که مجرمین به دو دسته بودن اونهایی که خلافهایی مثل چک و سرقت و اینا داشتند و اونهایی که نزاع خیابانی کتککاری چاقوکشی و تجاوز به عنف و پرخاشگریهای شدید داشتند و چهرهی اونها میانگینشان بر اساس الگوریتمهای مختلف به این گونه خواهد بود. خب تا اینجای کار به نظر میاد که هوش مصنوعی تونست اون مشکلی رو که رومبروزو صد و خوردهای سال پیش تمام تلاش میکرد که حل کنه بالاخره حل کرد و شما عکس پرسنلی آدما رو میدید و میتونی به کمک کامپیوتر این رو تمایز بذاری. البته یه نگرانیهایی بود که گفتم دولت چین خیلی با موازین دموکراسی و حقوق بشر منطبق نیست، این از این استفاده خواهد کرد و افراد رو طبقهبندی خواهد کرد، یه سه چهار سالی افراد این مقاله رو هی شخم میزدن و دیتاهای اون رو نگاه میکردن، ولی به نظر میومد ماشین واقعا تونسته به طرز خوبی اینها رو از هم تمایز بده. خب آیا اینجا تموم میشه؟ نه درواقع به نظر میاد که داستان تموم نمیشه، یعنی در واقع یه کتابی هست که حالا سر فرصت من این رو معرفی خواهم کرد، این مقاله رو توش قید کرده تو چند کتاب دیگه هم دیدم اتفاقا این مقاله جزء یکی از مقالات پر استناد است اسم این کتاب هست calling bulshit، یعنی حالا اسمشو بذاریم مزخرف یا چرند و وقتی اومدن این در واقع پژوهش رو دنبال کردن مدتها متخصصین هوش مصنوعی دنبال این بودن که آخه همچین چیزی نمیشه یعنی از روی چهره افراد به این قاطعیت بشه مجرم رو از غیرمجرم جدا کرد؟ و یه جملهی قشنگی در این کتاب calling bulshit هست که البته این جمله خیلی جاهای دیگه هم بهش استناد شده، میگه وقتی شما یه ادعای بزرگ میکنید باید شواهد خیلی قوی هم پشتش باشه و این ادعا خیلی بزرگه که یعنی از روی چهره بتونی اینا رو از هم تمایز بدی. یه عده شروع کردن اون چهرهها رو آنالیز کردن بازم میدیدن همون نتایج به دست میاد بعد یه عده پیدا شدن از محققین منتقد و اونهایی که دید دقیق دارن، گفتن صبر کن ببینیم شاید مشکل در این machine learning و الگوریتم نیست، نکنه خطا یه جای دیگس، همینجوری هم شما این تصویر نگاه کنید این حس رو دارید نمیدونم نگاه کنید این دوتا مال غیر مجرمینه، یه ذره خندان تر به نظرتون نیست؟ لبخند زنندهتر نیست به نظرتون تا اینها؟ اینا گفتن که خب باید ایراد رو پیدا بکنیم به این راحتی ما نمیتونیم قانع بشیم گشتن و دنبال این بودن که خیلی خب بگو ببینیم این تصاویر چگونه استخراج شدند؟ بیشتر تصاویری که مال گروه مجرمین بودن از کارت ملی و گواهینامهشون در صورتی که اونی که مال افراد غیر مجرم بودن علاوه بر کارت ملی و گواهینامه عکسهای پرسنلی در مراکز استخدام یا اون شرکتهاشون یا اون سایت مربوطهشون بود و نتیجهی جالبی که اینا گرفتن بعد از تحلیل دقیق چهرهها به این نتیجه رسیدن که درست در نگاه اول شما حس میکنی این عکسها همهش پرسنلیه، ولی وقتی آدمها برای یک کار مثبت دارن عکس میندازن مثل استخدام، مثل کارت پرسنلی، کارت در واقع اون محل خدمت یا عکسشون توی وبسایت بانک یا شرکت میاد به گونهای که ممکنه یک چشم عادی اونو تشخیص نده چهره خندانتر و بسیمتر هست و تبسم بیشتری داره تا اون چهرهای که شما صرفا برای کارت ملیت گرفتی، مردمم شوخی میکنن میگن آدم تو کارت ملیش خیلی بد میفته و برای مجرمین فقط از کارت ملی استفاده کرده بودن یا اون گواهینامه که دو جای سمج رسمیه که شما معمولا وقتی اونجا میخوای عکس بندازی یه خورده حواست نیست ولی جدیتر وایمیسی ولی این یکیا مال کارتهایی بود که به نوعی درست پرسنلی بود ولی جنبهی تبلیغ فرد داشت و فرد در اون یک لبخندی زده بود که بر چشم عادی دیده نمیشد، در واقع آنچه که هوش مصنوعی تمایز گذاشته بود نه مجرمیت در مقابل غیر مجرمیت بلکه اون تبسم اون لبخند خفیفی بود که با چشم عادی دیده نمیشد، ولی وقتی این تصاویر رو هم رو هم میذاری شما میبینی که این چهرهها یه خورده لبخند زنندهتره و در واقع کل این علم که چهره رو بتونی به کمک کامپیوتر مجرمین رو از غیر مجرمین جدا کنی روی هوا میره. این کتاب این مقاله رو مثال زده جاهای دیگه هم از این مثال میزنند و در واقع این درس عبرتیست که شما ممکنه در پژوهشهایی که به ظاهر خیلی هم علمیه، حواست سر یه جزئیات خیلی کوچیک نباشه و اونجا اشتباه کنی و نتیجهای کاملا متفاوت به دست بیاری. این یه تجربهی خیلی گرانبها بود برای دانشمندان علوم شناختی.