تفاوت میان نسخه‌های «پارادوکس سیمپسون»

ابرابزار ویکی‌سازی
(صفحه‌ای تازه حاوی «== پارادوکس سیمپسون == پرونده:Simpson_paradox_balances.svg|بندانگشتی|در این شکل درصد موفقی...» ایجاد کرد)
 
(ابرابزار ویکی‌سازی)
== پارادوکس سیمپسون ==
[[پرونده:Simpson_paradox_balances.svg|بندانگشتی|در این شکل درصد موفقیت <math>L_1</math>و <math>L_2</math>به ترتیب کمتر از <math>B_1</math>و <math>B_2</math>هستند اما به صورت جمع درصد موفقیت <math>L</math> بیشتر از <math>B</math>است.]]
'''پارادوکس سیمپسون''' به یک پدیده در آمار و احتمالات اشاره می کندمی‌کند که در آن هنگامی که داده هاداده‌ها به صورت دسته بندیدسته‌بندی شده بررسی بشوند نتایج متفاوتی نسبت به زمانی که به صورت کلی و یکجا بررسی شوند نشان می دهندمی‌دهند. معمولامعمولاً یکی از دلایلی که باعث این تفاوت می شودمی‌شود نامتوازن بودن دسته بندی هادسته‌بندی‌ها است. برای مثال هنگامی بررسی دو رخداد A و B هنگامی که این دو رخداد به صورت دسته بندی شدهدسته‌بندی‌شده بررسی می شوندمی‌شوند درصد موفقیت رخداد A در هر دسته نسبت به رخداد B بیشتر است اما هنگامی که داده هایداده‌های ایندو رخداد به صورت یکجا بررسی می شوندمی‌شوند درصد موفقیت رخداد B نسبت به A بیشتر می شودمی‌شود که این مخالف نتیجه بدست امدهآمده در حالت قبلی است.
 
== تاریخچه ==
ادوارد سیمپسون در سال ۱۹۵۱ برای اولین بار به این پدیده در یک مقاله خود اشاره کرد. البته قبل از او نیز کارل پیرسون در سال ۱۸۹۹ و اودنی یول در سال ۱۹۰۳ به مسائلی مشابه این پدیده نیز اشاره کرده بودند.<ref>{{یادکرد ژورنال|عنوان=|ژورنال=|ناشر=|تاریخ=|زبان=|شاپا=|doi=|پیوند=https://ftp.cs.ucla.edu/pub/stat_ser/r414.pdf|تاریخ دسترسی=}}</ref>
 
== توضیح<ref>{{یادکرد ژورنال|عنوان=|ژورنال=|ناشر=|تاریخ=|زبان=|شاپا=|doi=|پیوند=http://www-personal.umich.edu/~hlm/math425/simpson.pdf|تاریخ دسترسی=}}</ref> ==
به بیانی دیگر هنگامی که می خواهیممی‌خواهیم احتمال رویداد <math>X</math> را تحت شرایط <math>A</math>و <math>B</math> در دسته بندی هایدسته‌بندی‌های <math>F_i</math> بررسی کنیم، به ازای هر <math>i</math>اگر <math>P(X|AF_i) > P(X|BF_i)</math>باشد لزومالزوماً <math>P(A)>P(B)</math>نیست.
 
== مثال<ref>{{یادکرد ژورنال|عنوان=|ژورنال=|ناشر=|تاریخ=|زبان=|شاپا=|doi=|پیوند=http://www-bcf.usc.edu/~lototsky/MATH218/Simpsons%20paradox.pdf|تاریخ دسترسی=}}</ref> ==
 
=== درمان سنگ کلیه ===
این مثال یک اتفاق واقعی است که در آن در یک مرکز درمانی برای بررسی دو نوع درمان A و B برای بیماری سنگ کلیه ،کلیه، بیماران را به دو دسته تقسیم کرده اندکرده‌اند دسته اول بیماران با سنگ کلیه کوچک و دسته دوم بیماران با سنگ کلیه بزرگ هستند که نتایج درصد موفقیت درمان هادرمان‌ها در این آزمایش در جدول زیر آمده استآمده‌است.
{| class="wikitable"
!
!درمان B
|-
|سنگ هایسنگ‌های کوچک
|(۸۱/۸۷) '''۹۳٪'''
|(۲۳۴/۲۷۰) '''۸۷٪'''
|-
|سنگ هایسنگ‌های بزرگ
|(۱۹۲/۲۶۳) '''۷۳٪'''
|(۵۵/۸۰) '''۶۹٪'''
|(۲۸۹/۳۵۰) '''۸۳٪'''
|}
که با توجه به نتایج درصد موفقیت درمان A هم برای سنگ هایسنگ‌های کوچک و هم برای سنگ هایسنگ‌های بزرگ بیشتر از درمان B است ولی درصد موفقیت کلی درمان B بیشتر از A است که این نشان دهنده یک تناقض در نتایج داده هاداده‌ها است که این اتفاق به دلیل هم زمانیهم‌زمانی دو واقعه زیر است :
 
۱.# اندازه دسته بندی هادسته‌بندی‌ها با هم تفاوت زیادی دارند به طوری که برای بیماران با سنگ کلیه کوچک بیشتر درمان B و برای بیماران با سنگ کلیه بزرگ بیشتر درمان A بررسی شده استشده‌است.
۲.# تاثیرتأثیر [[اختلاط|متغیر اختلاطی]] بر روی درصد هایدرصدهای موفقیت که در اینجا این متغیر همان اندازه سنگ هاسنگ‌ها است. پس نتیجه این آزمایش تحت تاثیرتأثیر نوع سنگ هاسنگ‌ها نیز است.
 
=== جنسیت (Berkeley gender bias case ) ===
۲. تاثیر [[اختلاط|متغیر اختلاطی]] بر روی درصد های موفقیت که در اینجا این متغیر همان اندازه سنگ ها است. پس نتیجه این آزمایش تحت تاثیر نوع سنگ ها نیز است.
این مثال نیز یک مثال واقعی است که در آن از دانشگاه برکلی به دلیل اختلاف درصد قبولی زنان و مردان شکایت شده. در نتایج بدست آمده قبولی هاقبولی‌ها نشان دهنده آن بود که درصد بیشتری از مردان نسبت به زنان قبول شدهشده‌اند اند(حدود ۱۰٪ بیشتر).
 
=== جنسیت (Berkeley gender bias case ) ===
این مثال نیز یک مثال واقعی است که در آن از دانشگاه برکلی به دلیل اختلاف درصد قبولی زنان و مردان شکایت شده. در نتایج بدست آمده قبولی ها نشان دهنده آن بود که درصد بیشتری از مردان نسبت به زنان قبول شده اند(حدود ۱۰٪ بیشتر).
{| class="wikitable"
|+
|۳۵٪
|}
اما هنگام بررسی این نتایج در ادارات و بخش هایبخش‌های مختلف در واقع در بیشتر بخش هابخش‌ها درصد قبولی زنان بیشتر از مردان است.
{| class="wikitable"
|+
|'''۷٪'''
|}
این اختلاف در نتایج به دلیل این است که زنان تمایل بیشتری داشته اندداشته‌اند که در بخش هایبخش‌های درصد قبولی آنها کمتر بوده شرکت کنند اما مردان بیشتر در بخش هاییبخش‌هایی که درصد قبولی آنها بیشتر بوده و رقابت کمتر است شرکت کرده اندکرده‌اند که این یکی از عواملی است که در هنگام بررسی اختلاف قبولی بررسی نشده بود.
 
== منابع ==
{{پانویس}}
 
<references />