آزمون فرض آماری

آزمون فرضيه آماری (به انگلیسی: Statistical hypothesis testing) در علم آمار روشی است برای بررسی ادعاها یا فرض‌ها دربارهٔ پارامترهای توزیع در جوامع آماری. در این روش فرضيه صفر (به انگلیسی: Null-hypothesis) یا فرض اولیه، مورد بررسی ست که متناسب با موضوع مطالعه، فرضیه اي به عنوان فرضيه بدیل یا فرضيه مقابل (به انگلیسی: Alternative-hypothesis) انتخاب می‌شود تا درستی هر کدام نسبت به هم مورد آزمون قرار گیرد.[۱]

رویه کلی آزمون فرضيهویرایش

 
ناحیه رد و قبول فرض صفر

آزمون یک فرضيه آماری عبارت از به کار گرفتن مجموعه قواعد صریحی برای آن است که تصمیم بگیریم که آیا فرضيه صفر را بپذیریم یا آن را به نفع فرضيه مقابل رد کنیم. مثلاً فرض کنید که آماردانی می‌خواهد فرضيه صفر   را در برابر فرضيه مقابل   آزمون کند. برای انجام یک انتخاب، وی به تولید داده‌های نمونه ای از طریق ترتیب دادن یک آزمایش و سپس محاسبه مقدار یک آماره آزمون دست می‌زند که این آماره به او خواهد گفت که به ازای هر برآمد ممکن فضای نمونه ای چه اقدامی بکند؛ بنابراین، روش آزمون، مقادیر ممکن آماره آزمون را به دو مجموعه افراز می‌کند؛ یک ناحیه قبول برای   و یک ناحیه رد برای  .

  •  : فرضيه صفر
  •  : فرضيه مقابل

به ناحیه رد برای   ناحیه بحرانی آزمون، و به احتمال به دست آوردن مقداری برای اماره آزمون در داخل این ناحیه بحرانی، وقتی که  درست باشد، اندازه ناحیه بحرانی اطلاق می‌شود. بدین ترتیب، اندازه یک ناحیه بحرانی صرفاً احتمال   مرتکب شدن یک خطای نوع I است. این احتمال، سطح معنی دار بودن یک آزمون هم نامیده می‌شود.[۲]

انواع خطاویرایش

 
نمایش خطاهای نوع اول و دوم در آزمون فرض آماری

روشی که هم‌اکنون توصیف شد ممکن است به دو نوع خطا منجر شود:

خطای نوع Iویرایش

رد فرضيه صفر را وقتی که درست باشد خطای نوع I می‌نامند؛ احتمال ارتکاب خطای نوع I را با   نشان می‌دهند.

خطای نوع IIویرایش

قبول فرضيه صفر را وقتی که نادرست باشد، خطای نوع II می‌نامند؛ احتمال ارتکاب خطای نوع II را با   نشان می‌دهند.[۳]

کاربردهاویرایش

اگر مهندسی بخواهد بر مبنای داده‌های نمونه ای نظر دهد که آیا طول عمر متوسط نوع خاصی لاستیک چرخ ماشین حداقل ۲۲۰۰۰ مایل است یا نه، اگر یک کارشناس کشاورزی بخواهد بر مبنای آزمایش‌هایی نظر دهد که آیا نوع خاصی کود کشاورزی محصول لوبیای بیشتری نسبت به کود دیگر تولید می‌کند یا نه، و اگر یک سازنده محصولات دارویی بخواهد بر مبنای نمونه‌هایی نظر دهد که آیا ۹۰ درصد کلیه بیمارانی که داروی جدیدی را مصرف می‌کنند از بیماری خاصی بهبود خواهند یافت یا نه، همه این مسائل را می‌توان به زبان آزمون فرضيه‌های آماری برگرداند.

در مورد اول می‌توانیم بگوییم که این مهندس باید این فرضيه را آزمون کند که   پارامتر یک جامعه نمایی، حداقل ۲۲۰۰۰ است؛ در مورد دوم، می‌توانیم بگوییم که کارشناس کشاورزی باید نظر دهد که آیا   که در آن   و   میانگین‌های دو جامعه نرمال هستند؛ و در مورد سوم می‌توانیم بگوییم که سازنده باید نظر دهد که آیا  ، پارامتر یک جامعه دوجمله ای برابر با ۰٫۹۰ است یا نه.

مانند مثال‌های بالا، اغلب آزمون‌های آماری به پارامترهای توزیع‌ها می‌پردازند، ولی گاهی آن‌ها به نوع، یا ماهیت خود توزیع‌ها نیز می‌پردازند. به عنوان مثال، در اولین مثال از سه مثال بالا، آن مهندس همچنین ممکن است بخواهد نظر دهد که آیا واقعاً با نمونه ای از توزیع نمایی سر و کار دارد، یا اینکه آیا داده‌های او مقادیر متغیرهای تصادفی ای هستند که، مثلاً، دارای توزیع وایبول هستند.

فرضيه آماریویرایش

یک فرضيه آماری، حکم یا حدسی دربارهٔ توزیع یک یا چند متغیر تصادفی است. اگر یک فرضيه آماری توزیع را کاملاً مشخص کند، آن را فرضيه ساده و در غیر این صورت آن را فرضيه مرکب می‌نامند.

فرضيه‌هایی که به صورت یک رابطه تساوی بیان می‌شوند فرضيه‌های ساده نامیده می‌شوند ولی ممکن است این فرضيه‌ها به صورت نامساوی یا فرضيه‌های مرکب نیز باشند.

بدین ترتیب یک فرضيه ساده باید نه تنها شکل تابع توزیع مبنا، بلکه مقادیر همه پارامترها را نیز مشخص کند؛ بنابراین در سومین مثال از مثال‌های بالا، یعنی مثالی که با کارایی داروی جدید سر و کار دارد، فرضيه   ساده است، البته با این فرضيه که اندازه نمونه و دو جمله ای بودن توزیع جامعه را بدانیم. اما، در اولین مثال از مثال‌های بالا، فرض مرکب است، زیرا   مقدار مشخصی به پارامتر   نمی‌دهد.

برای اینکه بتوان ملاک‌های مناسبی برای فرضيه‌های آماری به وجود آورد، لازم است که فرضيه‌های مقابل را هم فرمول بندی کنیم. مثلاً در مثالی که در آن با طول عمر لاستیک سر و کار داشتیم، می‌توانیم این فرضيه مقابل را فرمول بندی کنیم که پارامتر   در توزیع نمایی، کمتر از ۲۲۰۰۰ است؛ در مثالی که با دو نوع کود سر و کار داشتیم می‌توانیم فرضيه مقابل   را فرمول بندی کنیم؛ و در مثالی که در آن با داروی جدید سر و کار داشتیم می‌توانیم این فرضيه مقابل را فرمول بندی کنیم که پارامتر   در توزیع دو جمله ای مفروض صرفاً ۰٫۶۰ است، که همان نرخ بهبودی از بیماری بدون داروی جدید است.

مفهوم فرضيه‌های ساده و مرکب در مورد فرضيه‌های بالا نیز به کار می‌رود، و در مثال اول اینک می‌توانیم بگوییم که فرضيه مرکب   را در برابر فرضيه مقابل مرکب   آزمون می‌کنیم که در آن   پارامتر جامعه نمایی است. به همین نحو، در مثال دوم، فرضيه مرکب   را در برابر فرضيه مقابل مرکب   آزمون می‌کنیم، که در آن   و   میانگین‌های دو جامعه نرمال اند، ور در مثال فرض سوم، فرضيه ساده   را در برابر فرضيه ساده   آزمون می‌کنیم که در آن   پارامتر یک جامعه دو جمله ای است که برای آن   معلوم است.[۲]

پیدایش اصطلاح فرضيه صفرویرایش

آمار دانان اغلب، به عنوان فرضيه‌های خود، ضد آنچه را که به باور آن‌ها درست است بیان می‌کنند. مثلاً، اگر بخواهیم نشان دهیم که دانش آموزان یک مدرسه بهره هوشی بالاتری نسبت به مدرسه دیگری دارند، می‌توانیم این فرضيه را فرمول بندی کنیم که تفاوتی در بین نیست، یعنی اینکه  . با این فرضيه می‌دانیم که چه انتظاری می‌توانیم داشته باشیم، اما اگر فرضيه را به صورت   فرمول بندی می‌کردیم، وضعیت این گونه نمی‌بود؛ مگر اینکه حداقل فاصله واقعی بین   و   را مشخص کنیم.

به همین نحو، اگر بخواهیم نشان دهیم که نوعی سنگ معدن، محتوی درصد اورانیوم بیشتری نسبت به سنگ معدن دیگری است، می‌توانیم این فرضيه را فرمول بندی کنیم که این درصدها یکسان است؛ و اگر بخواهیم نشان دهیم که تغییرپذیری بیشتری در کیفیت یک محصول نسبت به محصول دیگری وجود دارد، می‌توانیم این فرضيه را فرمول بندی کنیم که هیچ تفاوتی در بین نیست، یعنی اینکه  .

با توجه به فرضيه‌های عدم تفاوت، فرضيه‌هایی نظیر این‌ها به پیدایش اصطلاح فرضيه صفر منجر شدند، گرچه امروزه این اصطلاح به هر فرضیه اي اطلاق می‌شود که می‌خواهیم آن را آزمون کنیم.[۴]

مثال تحلیلیویرایش

با رجوع به مثال سوم در بالا، فرض کنید که سازنده داروی جدید می‌خواهد فرضيه صفر   را در برابر فرضيه مقابل   امتحان کند. آماره آزمون او  ، تعداد پیروزی‌ها (بهبودی‌ها) ی مشاهده شده در ۲۰ امتحان است، و او فرضيه صفر را می‌پذیرد در صورتی که  ؛ در غیر این صورت آن را رد خواهد کرد. حال می‌خواهیم   و   را محاسبه کنیم.

ناحیه قبول برای   با مقادیر  ؛ و ناحیه رد (یا ناحیه بحرانی) متناظر با مقادیر   داده می‌شود، بنابراین طبق جدول توزیع نرمال (توزیع دو جمله ای با زیاد شدن تکرار آزمایش‌های با توزیع نرمال تخمین زده می‌شود) داریم:

 

و

 .

یک آزمون خوب آن است که در آن   و   هر دو کوچک باشند و بنابراین به ما شانس بالایی برای اتخاذ تصمیم درست بدهد. احتمال خطای نوع II ( ) در مثال بالا نسبتاً زیاد است، اما می‌توان آن را با تغییر مناسب ناحیه بحرانی کم کرد. مثلاً اگر ناحیه قابل قبول   را در مثال بالا به کار ببریم، به طوریکه ناحیه بحرانی   باشد، به آسانی می‌توان تحقیق کرد که با این کار   و   خواهد شد؛ بنابراین، گرچه احتمال خطای نوع II کوچکتر شده‌است، احتمال خطای نوع I بزرکتر شده‌است. تنها راهی که می‌توان احتمال‌های هر دو نوع خطا را کم کرد افزایش دادن اندازه نمونه است، اما مادامی که  ثابت گرفته شود، این رابطه متقابل بین احتمال‌های خطای نوع I و نوع II از خصوصیات روش‌های تصمیم آماری است. به عبارت دیگر، اگر احتمال یک نوع خطا کاهش یابد، احتمال خطای نوع دیگر افزایش می‌یابد.[۲]

جستارهای وابستهویرایش

منابعویرایش

  1. سعید رضاخواه، آمار و احتمال کاربردی، انتشارات دانشگاه امیر کبیر، شابک ۹۶۴-۴۶۳-۰۹۱-۲ (کتابخانه ملی: م۷۹–۲۰۶۷۴) مقدار |شابک= را بررسی کنید: invalid character (کمک)
  2. ۲٫۰ ۲٫۱ ۲٫۲ فروند، جان (۱۳۷۸). آمار ریاضی. تهران: مرکز نشر دانشگاهی. صص. ۴۱۰.
  3. اهرابی، فریدون؛ تقوی طلب، محسن. احتمالات و تحلیل آماری. بانک مرکزی جمهوری اسلامی.
  4. ج. لارسن، هرولد (۱۳۸۹). نظریه احتمالات و نتیجه‌گیری آماری. تهران: موسسه انتشارات علمی دانشگاه صنعتی شریف.