شماره 221: سیمای مجرمان

پادکست دکتر مکری
آبان 1399

شماره 221: سیمای مجرمان

پادکست دکتر آذرخش مکری
شماره 221: سیمای مجرمان
Loading
/

متن پادکست

خب اگر موافق باشید یک پژوهش تامل‌برانگیز دیگه رو با هم مرور کنیم، اینم از اون پژوهش‌هایی بود که در واقع دو سه چهار سال اخیر خیلی جنجال و سروصدا به پا کرد و خیلی در رسانه‌های عمومی و حتی مطبوعاتی که برای مخاطب عام بود، نتایجش منعکس شد و خیلی مناقشه برانگیز شد. اسم پژوهش بود automated inference on criminality using face images که مربوط به سال دو هزار و شونزده هست و محققین اون دو نفر بودند که چینی هستند وو و ژانگ، اما این پژوهش راجع به چی بود و چه نتایجی در بر داشت؟ چندین قرن هست که بشر در این فکره که آیا مجرمین، اون‌هایی که رفتارهای مجرمانه دارند آیا سیمای خاصی دارند؟ آیا جنایتکاران، افراد خلافکار، افراد ضد اجتماعی، افرادی که جرم مرتکب می‌شن، آیا می‌توان اونها را از روی چهره‌شان شناخت و در واقع افراد درستکار در مقابل افراد نابکار آیا تفاوت‌هایی در چهره‌شون وجود داره یا نه؟ خب از دیرباز شایعاتی بود ادعاهایی بود ولی یکی از منسجم‌ترین و میشه گفت جدی‌ترین تلاش‌ها برای طبقه‌بندی انسان‌ها بر اساس چهره‌شون توسط Cesare Lombroso جرم‌شناس مشهور ایتالیایی صورت گرفت و او کتابی داره که بعدا در سال هزار و هشتصد و هفتاد و شیش چاپ شده، ولی بعدا مجلدات دیگه‌ای بهش اضافه میشه و میشه گفت یه بخش عمده‌ای از عمر لومبروزو رو به خودش اختصاص میده به نام legoe mo delinquent یعنی انسان خلافکار، انسان مجرم. و در جریان این کتاب او سعی داره چهره‌ی افراد رو بر اساس جرم‌هایی که مرتکب می‌شن و خلاف‌هایی که مرتکب می‌شن ترسیم کنه و برای خودش یک طبقه‌بندی علم می‌کنه که مثلا این حالت پیشانی، این حالت گونه یا این حالت در واقع چانه بیشتر موید جرم‌های خاصی هست و علمی رو پایه‌گذاری می‌کنه که بر اساس اون سعی کنن افراد مجرم رو شناسایی و دستگیر کنن اما این علم ره به جایی نمی‌بره و تحقیقات بعدی که نزدیکیای اواخر عمر لومبروزو صورت می‌گیره علم او رو نقش بر آب میکنه و ادعا صورت می‌گیره که از روی چهره نمی‌تونی در واقع نیات، شخصیت و در عین حال رفتارهای مجرمانه را در افراد شناسایی کنی اما مقاله‌ی حاضر چی هست؟ مقاله‌ی حاضر تقریبا یه چیزی حدود صد سال بعد از اون رد شدن ادعاهای لومبروزو یک‌ بار دیگه سعی می‌کنه که این پدیده رو آزمایش کنه و این رو چینی‌ها انجام دادن بر روی هزار و هشتصد و پنجاه و شیش چهره. این هزار و هشتصد و پنجاه و شیش چهره هزار و صد و بیست و شیش تای اون‌ها غیر مجرم بودن و در واقع چهره رو از کارت شناسایی کارت ملی اونها به قول معروف یا گواهینامه‌ی اونها یا جاهای دیگه استخراج کرده بودند و هفتصد و سی مورد دیگه هم داشتیم که این‌ها مجرمین بودند که باز چهره‌ی اون‌ها رو از در واقع کارت‌های شناسایی و کارت در واقع هویت اون‌ها استخراج شده، منتهی در نظر بگیرید که ادعایی که نویسنده‌های مقاله کردن اینه که این چهره‌ها به عنوان مجرمین مربوط به تصاویری که دادگستری و زندان‌ها و اینا گرفته نیست، یعنی اون اصطلاحی که خارجی‌ها دارند میگن ماگ شات، اونی که یه دونه در واقع پلاک میندازن گردنش، لباس راه راه می‌پوشن مربوط به اون نبوده، از کارت‌های شناساییشون گرفته شده و البته در مورد این هزار و صد و بیست و شش تایی که در مورد غیر مجرمین بود علاوه بر کارت‌های شناساییشون از صفحه‌های رسمی و homepage اداری و در واقع شغلی اونها هم استفاده شده بود یعنی مثلا فرض کنید کارمند شرکتی بوده این کارمند عکس خودش رو به صورت پرسنلی نه عکس‌های تفریحی و خانوادگی و اینا در اون سایت گذاشته و اینا استخراج کرده بودند همه مرد بودن همه نژاد چینی بودند سنشون بین هیجده تا پنجاه و پنج سال بود، عکس همه‌ش در قطع پرسنلی بود و هنگامی که خواستند این پژوهش رو انجام بدن اون در واقع جوانب عکس رو ویراستاری کرده بودند یعنی هیچکس فرض کنید عینک یا مو یا لباس مشخص نبود فقط یک چهره رو بریده بودن و خارج کرده بودن، منتهی کاری که کرده بودند این بود که نه به داورها محولش کنند بلکه به هوش مصنوعی محول کنند و یک نوع machine learning رو توی اون اعمال کرده بودند، از چهار روش مختلف یادگیری هوشمند برای طبقه‌بندی تصاویر استفاده کردند اینجا من اینا رو عینا از مقاله استخراج کردم، خدمتتون میگم، راستشو بخواین اعتراف کنم من چیز زیادی در این مورد نمی‌دونم فقط دارم گزارش اونا رو میگم از روش‌های logistic regression، k nearest neighbor یعنی KNN، support vector machine، یا SVM، conventional neural network یا CNN استفاده کردن، ظاهرا این‌ها روش‌ها یا میشه گفت الگوهایی‌ست که در اون به کار می‌برند، تصاویر افراد مجرم و غیر مجرم رو به یک کامپیوتر نشون میدن و بعد مشخص می‌کنن و بعد اجازه میدن که بعد از اینکه هر کدوم از این‌ها رو لیبل زدن و گفتن که کدوم به کدومه اون الگوریتم یا اون در واقع روشی رو که ماشین استخراج می‌کنه برای سنجش بقیه‌ی تصاویر به کار می‌برن و در واقع به کمک این سعی می‌کنن ببینن آیا ماشین میتونه یاد بگیره شرایطی رو از این تصاویر استخراج بکنه، بر اساس این چهار روش مختلف، که بتونه به طرز معنی داری تمایز قائل بشه بین چهره‌ی مجرمین با چهره‌ی افراد عادی. خب نتایجش توی این نمودار هست یعنی شاید همین نمودار لب کلام رو ارائه میده چهار روش مختلف رو می‌بینید همون طور که می‌بینید در واقع روش CNN از همه در واقع موثرتر و قاطع‌تر بوده و چیزی که نتیجه نهایی این مقاله بود، اینه که هشتاد و نه ممیز نیم درصد یعنی هشتاد و نه و نیم درصد به کمک روش CNN می‌تونستن با دقت هشتاد و نه و نیم درصد تصاویر مجرمین رو از غیر مجرمین جدا بکنن، یعنی کامپیوتر یاد گرفته بود که این کار رو بکنه البته شما می‌بینید روش‌های دیگه دقتشون یه مختصری کمتر میشه، SVM، KNN، و LR و اگر همه‌ی اینها رو تلفیق کنیم اینا ادعا می‌کردند بالای نود درصد میتونیم چهره‌ی این افراد رو از هم تمایز بدیم. خب می‌تونید حدس بزنید که این چه بمب خبری‌ای بود و به خصوص این که یه تعدادی از دانشمندان هوش مصنوعی اومدن یافته‌های اونا رو تکرار کردن و به همین نتایج رسیدن. یعنی به نظر میاد که سیستم هوش مصنوعی می‌تونه از طریق عکس پرسنلی با یک دقت نسبتا معقولی نزدیک نود درصد دقت به شما بگه که این فرد خلافکاره یا آدم خوبیه و این مقاله سریعا انعکاس پیدا کرد به رسانه‌های عمومی، حالا اگر شما تو گوگل یک سرچ ساده بکنید و اسم نویسنده‌ها رو بزنید یا در واقع تشخیص چهره بر اساس machine learning هوش مصنوعی بزنید چهره‌ی مجرمین بر اساس هوش مصنوعی بزنید تصاویر این مقاله و اسم این نویسنده‌ها سریع میاد بالا. و اونا چه چیزایی رو یافت کرده بودن، یعنی بعدا که اومدن تحلیل کردن ببینن که اون ماشین از چه طریقی در واقع به تمایز چهره‌ی مجرمین از غیر مجرمین می‌پردازه و اون بزرگترین مولفه‌هایی که اینها رو از هم تمایز میدن چیا هست؟ خب یکیش این زاویه‌ی درواقع تتاست، زاویه‌ای هست که اگر شما دو نقطه‌ی در واقع لبها رو به نوک بینی وصل کنید یه زاویه به دست میاد، که این در مجرمین با افراد غیر مجرم تفاوت معنی‌داری داشت، همچنین این در واقع خط رو هست، این پی نیست رو یونانیه، که در واقع هر چقدر این انحنا رو به بالاتر داره افراد سابقه‌ی غیر مجرمیت دارند و هر چقدر مستقیم‌تره، فرد مجرم‌تره، و درواقع سومین یافته‌ای که داشتند این فاصله‌ی دی بود که فاصله‌ی دو تا قسمت درونی پلک‌ها هست، و هر کدوم از اینها تفاوت‌هاش رو شما، تفاوت‌ میانگین‌هاشو در میان غیر مجرمین و مجرمین می‌بینید و همونطور که می‌بینید این زاویه‌ی تتا خیلی به نظر میاد تعیین کننده‌ست یه تفاوت محسوسی داره، در غیر مجرمین اون زاویه خیلی بازه در صورتیکه در مجرمین این زاویه بسته تره و در عین حال این خط در واقع رو هست که اونم باز یک تفاوت ملموسی داره، هر چقدر در افراد غیرمجرم‌تر باشن این شیب بیشتر یا شکم بیشتری به سمت بینی نشون میده و فاصله‌ی دی هم که در مقام سوم قرار داره و حتی برای این که تکمیل کرده باشند پژوهش‌هاشون رو اومدن این کار رو کردن که اینها تصاویر تمام افرادی را که مجرم بودند با تمام افرادی را که غیر مجرم بودن روی هم مرف کردن یعنی روی هم قرار دادن و میانگین کلی گرفتن یعنی اون هزار و دویست نفر رو یه میانگین ازش درست کردن و از اون هفتصد و خرده‌ای نفر هم یه میانگین، این میانگین مجرمین هست که بر اساس الگوریتم‌های مختلف تقسیم شده و اینم میانگین چهره‌ی غیرمجرمان هست که کامپیوتر هم به خوبی می‌تونه این دوتا رو از هم تمایز بده، یعنی در واقع اگر شما نگاه کنید انسان‌های خوب رو جمع بکنید لااقل نژاد چینی مرد و اون‌ها رو، رو هم رو هم عکس‌هاشونو بذارید همچین تصویری به دست میاد و انسان‌های نابکار، خلافکار، مجرمین، سارقین، اینم بگم که مجرمین به دو دسته بودن اون‌هایی که خلاف‌هایی مثل چک و سرقت و اینا داشتند و اون‌هایی که نزاع خیابانی کتک‌کاری چاقوکشی و تجاوز به عنف و پرخاشگری‌های شدید داشتند و چهره‌ی اون‌ها میانگینشان بر اساس الگوریتم‌های مختلف به این گونه خواهد بود. خب تا اینجای کار به نظر میاد که هوش مصنوعی تونست اون مشکلی رو که رومبروزو صد و خورده‌ای سال پیش تمام تلاش می‌کرد که حل کنه بالاخره حل کرد و شما عکس پرسنلی آدما رو میدید و می‌تونی به کمک کامپیوتر این رو تمایز بذاری. البته یه نگرانی‌هایی بود که گفتم دولت چین خیلی با موازین دموکراسی و حقوق بشر منطبق نیست، این از این استفاده خواهد کرد و افراد رو طبقه‌بندی خواهد کرد، یه سه چهار سالی افراد این مقاله رو هی شخم‌ می‌زدن و دیتاهای اون رو نگاه می‌کردن، ولی به نظر میومد ماشین واقعا تونسته به طرز خوبی این‌ها رو از هم تمایز بده. خب آیا اینجا تموم میشه؟ نه درواقع به نظر میاد که داستان تموم نمیشه، یعنی در واقع یه کتابی هست که حالا سر فرصت من این رو معرفی خواهم کرد، این مقاله رو توش قید کرده تو چند کتاب دیگه هم دیدم اتفاقا این مقاله جزء یکی از مقالات پر استناد است اسم این کتاب هست calling bulshit، یعنی حالا اسمشو بذاریم مزخرف یا چرند و وقتی اومدن این در واقع پژوهش رو دنبال کردن مدت‌ها متخصصین هوش مصنوعی دنبال این بودن که آخه همچین چیزی نمیشه یعنی از روی چهره افراد به این قاطعیت بشه مجرم رو از غیرمجرم جدا کرد؟ و یه جمله‌ی قشنگی در این کتاب calling bulshit هست که البته این جمله خیلی جاهای دیگه هم بهش استناد شده، میگه وقتی شما یه ادعای بزرگ می‌کنید باید شواهد خیلی قوی هم پشتش باشه و این ادعا خیلی بزرگه که یعنی از روی چهره بتونی اینا رو از هم تمایز بدی. یه عده شروع کردن اون چهره‌ها رو آنالیز کردن بازم می‌دیدن همون نتایج به دست میاد بعد یه عده پیدا شدن از محققین منتقد و اون‌هایی که دید دقیق دارن، گفتن صبر کن ببینیم شاید مشکل در این machine learning و الگوریتم نیست، نکنه خطا یه جای دیگس، همینجوری هم شما این تصویر نگاه کنید این حس رو دارید نمیدونم نگاه کنید این دوتا مال غیر مجرمینه، یه ذره خندان تر به نظرتون نیست؟ لبخند زننده‌تر نیست به نظرتون تا اینها؟ اینا گفتن که خب باید ایراد رو پیدا بکنیم به این راحتی ما نمی‌تونیم قانع بشیم گشتن و دنبال این بودن که خیلی خب بگو ببینیم این تصاویر چگونه استخراج شدند؟ بیشتر تصاویری که مال گروه مجرمین بودن از کارت ملی و گواهینامه‌شون در صورتی که اونی که مال افراد غیر مجرم بودن علاوه بر کارت ملی و گواهینامه عکس‌های پرسنلی در مراکز استخدام یا اون شرکت‌هاشون یا اون سایت مربوطه‌شون بود و نتیجه‌ی جالبی که اینا گرفتن بعد از تحلیل دقیق چهره‌ها به این نتیجه رسیدن که درست در نگاه اول شما حس می‌کنی این عکسها همه‌ش پرسنلیه، ولی وقتی آدم‌ها برای یک کار مثبت دارن عکس میندازن مثل استخدام، مثل کارت پرسنلی، کارت در واقع اون محل خدمت یا عکسشون توی وبسایت بانک یا شرکت میاد به گونه‌ای که ممکنه یک چشم عادی اونو تشخیص نده چهره‌ خندان‌تر و بسیم‌تر هست و تبسم بیشتری داره تا اون چهره‌ای که شما صرفا برای کارت ملیت گرفتی، مردمم شوخی می‌کنن میگن آدم تو کارت ملیش خیلی بد میفته و برای مجرمین فقط از کارت ملی استفاده کرده بودن یا اون گواهینامه که دو جای سمج رسمیه که شما معمولا وقتی اونجا می‌خوای عکس بندازی یه خورده حواست نیست ولی جدی‌تر وایمیسی ولی این یکیا مال کارتهایی بود که به نوعی درست پرسنلی بود ولی جنبه‌ی تبلیغ فرد داشت و فرد در اون یک لبخندی زده بود که بر چشم عادی دیده نمی‌شد، در واقع آنچه که هوش مصنوعی تمایز گذاشته بود نه مجرمیت در مقابل غیر مجرمیت بلکه اون تبسم اون لبخند خفیفی بود که با چشم عادی دیده نمی‌شد، ولی وقتی این تصاویر رو هم رو هم میذاری شما می‌بینی که این چهره‌ها یه خورده لبخند زننده‌تره و در واقع کل این علم که چهره رو بتونی به کمک کامپیوتر مجرمین رو از غیر مجرمین جدا کنی روی هوا میره. این کتاب این مقاله رو مثال زده جاهای دیگه هم از این مثال می‌زنند و در واقع این درس عبرتی‌ست که شما ممکنه در پژوهش‌هایی که به ظاهر خیلی هم علمیه، حواست سر یه جزئیات خیلی کوچیک نباشه و اونجا اشتباه کنی و نتیجه‌ای کاملا متفاوت به دست بیاری. این یه تجربه‌ی خیلی گرانبها بود برای دانشمندان علوم شناختی.
Document