بوت‌استرپینگ (آمار): تفاوت میان نسخه‌ها

محتوای حذف‌شده محتوای افزوده‌شده
Rezabot (بحث | مشارکت‌ها)
جز ربات: افزودن رده از مقاله همسنگ در ویکی‌انگلیسی
R0stam (بحث | مشارکت‌ها)
بدون خلاصۀ ویرایش
خط ۱:
در [[آمار]]، '''بوت استرپینگ''' {{انگلیسی|Bootstrapping}} یک متد کامپیوتری است برای نسبت دادن معیار دقت به تخمینهای داده یدادهٔ نمونه ([[Bradley_Efron|Efron]] و[[Robert_Tibshirani|Tibshirani]] 1994). دراین تکنیک تنها با یک روش خیلی ساده میتوانمی‌توان تقریبا هر آماره ایآماره‌ای از توزیع داده هایداده‌های نمونه را تخمین زد. به طور عمومی این روش از روشهای [[بازنمونه گیری]] به حساب می آیدمی‌آید.
 
بوت استرپینگ در واقع تخمین ویژگی هایویژگی‌های (مثل واریانس)یک تخمین زننده استزننده‌است با استفاده از اندازه گیری همین ویژگیها در یک توزیع تقریبی از کل داده هایداده‌های نمونه. یک انتخاب استاندارد برای توزیع تقریبی، توزیع تجربی داده هایداده‌های مشاهده شده استشده‌است. در حالتی که بتوان فرض کرد مجموعه ایمجموعه‌ای از مشاهده هامشاهده‌ها از جمعیتی مستقل و به طور مساوی توزیع شده می باشد،می‌باشد، بوت استرپینگ میتواندمی‌تواند با ساخت تعدای بازنمونه پیاده سازی شود، که هرکدام از این بازنمونه هایبازنمونه‌های در واقع نمونه هایینمونه‌هایی رندم با جایگذاری از مجموعه داده هایداده‌های اصلی هستند.
 
همچنین از بوت استرپینگ میتوانمی‌توان در ساخت آزمون فرض آماری استفاده کرد. از این روش معمولا به عنوان جایگزینی برای متدهای استنباطی بر پایه فرضهای پارامتری هنگامی که در مورد این فرضها شک داشته باشیم استفاده میشودمی‌شود. یا مواردی که استنباط پارامتری غیر ممکن باشد یا برای محاسبه یمحاسبهٔ خطای استاندار فرمول محاسباتی پیچیده شود از بوت استرپینگ استفاده میکنیممی‌کنیم.
 
=== فواید ===
یک فایده بزرگ بوت استرپینگ سادگی آن است. این روش برای تخمین خطای استاندارد و بازه یبازهٔ اطمینان برای تخمین زننده های پیچیدهزننده‌های یپیچیدهٔ پارامترهای توزیع، مثل [[نقطه هاینقطه‌های صدکی]] (percentile points)، نسبتها، کسر برتری (odds ratio)و ضرایب همبستگی سر راست است. بعلاوه روش مناسبی برای کنترل و بررسی پایداری نتایج است.
 
=== مضرات ===
به دلیل اینکه بوت استرپینگ تحت برخی شرایط به طور مجانبی ثابت است، تضمین نمونه-متناهی عمومی را فراهم نمیکندنمی‌کند. بعلاوه، گرایش به این دارد که خیلی خوشبینانه عمل کند. ظاهر ساده یسادهٔ این روش ممکن است پیشفرضهای مهم برای آنالیز بوت استرپ (مثل فرض مستقل بودن نمونه هانمونه‌ها) را پنهان کند در حالی که در روشهای دیگر این پیشفرضها به صورت رسم بیان میشوندمی‌شوند.
 
== توصیف غیر رسمی ==
بوت استرپینگ این امکان را برای یک نفر فراهم می سازدمی‌سازد که تعداد زیادی نسخه ینسخهٔ جایگزین از یک آماره را که به طور معمول از یک نمونه محاسبه میشودمی‌شود را جمع آوری کند. به عنوان مثال، فرض کنید که ما علاقه مند به جمع آوری اطلاعات در مورد قد افراد در جهان هستیم. به دلیل اینکه نمیتوانیمنمی‌توانیم کل جمعیت را اندازه گیری کنیم، تنها یک از قسمت کوچک نمونه برداری می کنیممی‌کنیم. از این نمونه فقط یک آماره قابل محاسبه است،محاسبه‌است، مثلا یک میانگین یا یک انحراف معیار. در نتیجه نمیتوانیمنمی‌توانیم متوجه شویم که آماره هاآماره‌ها چه قدر و در چه بازه ایبازه‌ای تغییر میکنندمی‌کنند. اما هنگامی که از بوت استرپ استفاده کنیم ما به صورت تصادفی یک نمونه ینمونهٔ ''n'' تایی از ''N'' تا داده یدادهٔ نمونه بر می داریم،می‌داریم، به طوریکه هر نفر حد اکثر ''t'' بار میتواندمی‌تواند انتخاب شود. با چندین بار انجام این کار در واقع تعداد زیادی مجموعه یمجموعهٔ داده میسازیممی‌سازیم که برای هرکدام میتوانیممی‌توانیم یک آماره حساب کنیم. بنابراین به این روش یک تخمین از توزیع آماره به دست می آیدمی‌آید. نکته ینکتهٔ مهم در این روش ساختن نسخه جایگزین از داده هاییداده‌هایی است که ممکن است ما دیده باشیم.
 
== موارد کاربر روش بوت استرپینگ ==
آدر (Adèr) و همکارانش (در سال ۲۰۰۸) روش بوت استرپ را برای به کار گیری در موارد زیر توصیه کردند:
 
* وقتی که توزیع یک آمارهٔ مورد نظر ناشناخته یا پیچیده‌است.
آدر (Adèr) و همکارانش (در سال 2008) روش بوت استرپ را برای به کار گیری در موارد زیر توصیه کردند:
* وقتی که اندازهٔ نمونه برای یک استنباط آماری سرراست ناکافی است.
 
* وقتی که محاسبات توانی لازم است انجام شود، اما نمونهٔ پایلوت کوچکی در اختیار داریم.
*وقتی که توزیع یک آماره ی مورد نظر ناشناخته یا پیچیده است.
*وقتی که اندازه ی نمونه برای یک استنباط آماری سرراست ناکافی است.
*وقتی که محاسبات توانی لازم است انجام شود، اما نمونه ی پایلوت کوچکی در اختیار داریم.
 
== چه تعداد نمونه بوت استرپ کافی است؟ ==
تعداد نمونه‌های توصیه شده برای این روش با افزایش توان محاسباتی کامپیوترها به تدریج افزایش یافته‌است. اگر نتایج واقعا مهم اند باید تا جایی که توان محاسباتی مامپیوتر و محدودیت زمان اجازه می‌دهد باید تعداد نمونه‌ها را زیاد کرد. افزایش تعداد نمونه‌ها باعث افزایش اطلاعات در داده‌های اصلی نمی‌شود بلکه فقط اثر خطای نمونه برداری تصادفی را کاهش می‌دهد.
 
== انواع طرح‌های بوت استرپ ==
تعداد نمونه های توصیه شده برای این روش با افزایش توان محاسباتی کامپیوترها به تدریج افزایش یافته است. اگر نتایج واقعا مهم اند باید تا جایی که توان محاسباتی مامپیوتر و محدودیت زمان اجازه میدهد باید تعداد نمونه ها را زیاد کرد. افزایش تعداد نمونه ها باعث افزایش اطلاعات در داده های اصلی نمیشود بلکه فقط اثر خطای نمونه برداری تصادفی را کاهش میدهد.
در مسائل یک متغیری، معمولا قابل قبول است که بازنمونه گیری از مشاهده‌ها با جایگذاری باشد. در نمونه‌های کوچک ممکن است یک روش بوت استرپ پارامتری ترجیح داده شود. برای مسائل دیگر یک ''بوت استرپ نرم'' احتمالا ترجیح داده خواهد شد.
 
برای مسائل رگرسیون جایگزین‌های مختلفی موجودند.
==انواع طرح های بوت استرپ ==
 
=== بازنمونه گیری ===
در مسائل یک متغیری، معمولا قابل قبول است که بازنمونه گیری از مشاهده ها با جایگذاری باشد.در نمونه های کوچک ممکن است یک روش بوت استرپ پارامتری ترجیح داده شود. برای مسائل دیگر یک ''بوت استرپ نرم'' احتمالا ترجیح داده خواهد شد.
 
بوت استرپ به طور کلی برای تقریب توزیع آماره‌ها مفید است، بدون استفاده از روشهای معمول تئوری مثل تستهای آماری z-statistic, t-statistic. از بوت استرپ معمولا وقتی استفاده می‌شود که هیچ روش معمول و تحلیلی ای برای کمک به تخمین توزیع آماره‌های مورد نظر وجود ندارد. حداقل دو روش برای این نوع نمونه گیری وجود دارد:
برای مسائل رگرسیون جایگزین های مختلفی موجودند.
 
# الگوریتم مونت کارلو که برای استفاده در اینجا بسیار ساده نیز هست. ابتدا با جایگذاری از داده‌ها بازنمونه گیری می‌کنیم، اندازهٔ بازنمونه باید برابر اندازهٔ مجموعه دادهٔ اصلی باشد. سپس آمارهٔ مورد نظر با استفاده از بازنمونه به دست آمده از مرحلهٔ اول محاسبه می‌شود و اینکار چندین بار تکرار می‌شود تا جواب دقیقتری به دست آید.
===بازنمونه گیری===
# روش دقیق نیز شبیه مونت کارلو است با این تفائت که در این روش تمام بازنمونه‌های ممکن از مجموعهٔ داده‌ها محاسبه می‌شوند. تعداد بازنمونه‌ها برابر می‌شود با <math>\binom {2n-1}n</math> که در آن n اندازه مجموعه داده‌های اولیه‌است.
بوت استرپ به طور کلی برای تقریب توزیع آماره ها مفید است، بدون استفاده از روشهای معمول تئوری مثل تستهای آماری z-statistic, t-statistic . از بوت استرپ معمولا وقتی استفاده میشود که هیچ روش معمول و تحلیلی ای برای کمک به تخمین توزیع آماره های مورد نظر وجود ندارد. حداقل دو روش برای این نوع نمونه گیری وجود دارد:
 
=== بوت استرپ نرم ===
# الگوریتم مونت کارلو که برای استفاده در اینجا بسیار ساده نیز هست. ابتدا با جایگذاری از داده ها بازنمونه گیری میکنیم، اندازه ی بازنمونه باید برابر اندازه ی مجموعه داده ی اصلی باشد. سپس آماره ی مورد نظر با استفاده از بازنمونه به دست آمده از مرحله ی اول محاسبه میشود و اینکار چندین بار تکرار میشود تا جواب دقیقتری به دست آید.
در این حالت تعداد کمی از نویزهای تصادفی با مرکز صفر (معمولا دارای توزیع نرمال) به هر بازنمونه اضافه می‌شوند. این معادل نمونه برداری از یک تخمین [[kernel density]] از داده‌ها است.
# روش دقیق نیز شبیه مونت کارلو است با این تفائت که در این روش تمام بازنمونه های ممکن از مجموعه ی داده ها محاسبه میشوند. تعداد بازنمونه ها برابر می شود با <math>\binom {2n-1}n</math> که در آن n اندازه مجموعه داده های اولیه است.
 
=== بوت استرپ نرمپارامتری ===
در این حات یک مدل پارامتری به داده‌ها برازش می‌شود، معمولا با استفاده از درستنمایی ماکزیمم، و نمونه‌های اعداد تصادفی از این مدل برازش شده بیرون کشیده می‌شوند. معمولا نمونه‌های بیرون کشیده شده اندازه‌ای برابر با اندازه داده‌ها اصلی دارند.
در این حالت تعداد کمی از نویزهای تصادفی با مرکز صفر (معمولا دارای توزیع نرمال) به هر بازنمونه اضافه میشوند. این معادل نمونه برداری از یک تخمین [[kernel density]] از داده ها است.
سپس کمیت یا تخمین آمارهٔ مورد نظر از این داده‌ها بدست می‌آید. و همانند دیگر روشهای بوت استرپ این کار چندین بار تکرار می‌شود. استفاده از بوت استرپ در این گونه موارد منجر به روشهایی می‌شود که متفائت اند با روشهای استنباط آماری پایه برای همین مدل.
 
=== بازنمونه گیری باقیمانده‌ها ===
===بوت استرپ پارامتری===
روش دیگر بوت استرپینگ در مسائل رگرسیون بازنمونه گیری از [http://en.wikipedia.org/wiki/Errors_and_residuals_in_statistics باقیمانده‌ها] است. این روش به شکل زیر است:
در این حات یک مدل پارامتری به داده ها برازش میشود، معمولا با استفاده از درستنمایی ماکزیمم، و نمونه های اعداد تصادفی از این مدل برازش شده بیرون کشیده میشوند. معمولا نمونه های بیرون کشیده شده اندازه ای برابر با اندازه داده ها اصلی دارند.
# مدل را برازش کن و مقادیر <math>\hat y_i</math> و باقیمانده‌ها <math>\hat{\epsilon}_i = y_i - \hat{y}_i, (i = 1,\dots, n)</math>.
سپس کمیت یا تخمین آماره ی مورد نظر از این داده ها بدست می آید. و همانند دیگر روشهای بوت استرپ این کار چندین بار تکرار میشود. استفاده از بوت استرپ در این گونه موارد منجر به روشهایی میشود که متفائت اند با روشهای استنباط آماری پایه برای همین مدل.
 
===بازنمونه گیری باقیمانده ها===
 
روش دیگر بوت استرپینگ در مسائل رگرسیون بازنمونه گیری از [http://en.wikipedia.org/wiki/Errors_and_residuals_in_statistics باقیمانده ها] است. این روش به شکل زیر است:
#مدل را برازش کن و مقادیر <math>\hat y_i</math> و باقیمانده ها <math>\hat{\epsilon}_i = y_i - \hat{y}_i, (i = 1,\dots, n)</math>.
را بازیابی کن.
# به ازای هر جفت, (''x<sub>i</sub>'', ''y<sub>i</sub>''), که در آن ''x<sub>i</sub>'' متغیر توضیحی است، یک بازنمونه تصادفی باقیمانده اضافه کن ،کن،<math>\hat{\epsilon}_j</math>، به جواب متغیر ''y<sub>i</sub>''. به بیان دیگر متغیرهای ساختگی جواب <math>y^*_i = \hat{y}_i + \hat{\epsilon}_j</math> را که در آن ''j'' متغیر تصادفی انتخاب شده از لیست (1, …, ''n'') است به ازای هر ''i''.
# مدل را مجددا برازش کن با استفاده از متغیرهای ساختگی ''y*<sub>i</sub>'' و بازیابی کمیتهای مورد نظر
# مراحل ۲و 3۳ را به تعدادی که از نظر آماری معنی دار باشد تکرار کنید.
 
=== بوت استرپ پروسه گوسی رگرسیون ===
وقتی مه داده‌ها یه صورت موقت با هم همبستگی دارند، بوت استرپ مستقیم همبستگی‌های ذاتی را از بین می‌برد. این متد از رگرسیون گوسی استفاده می‌کند تا یک مدل احتمالاتی را برازش کند. پروسه‌های گوسی متدهایی از بایزین هستند اما در اینجا استفاده می‌شوند تا یک روش پارامتریک بوت استرپ بسازند، که به سادگی به داده‌های مستقل از زمان اجازهٔ می‌دهد به حساب آورده شوند.
 
=== بوت استرپ ریسکی (wild) ===
وقتی مه داده ها یه صورت موقت با هم همبستگی دارند، بوت استرپ مستقیم همبستگی های ذاتی را از بین میبرد. این متد از رگرسیون گوسی استفاده میکند تا یک مدل احتمالاتی را برازش کند. پروسه های گوسی متدهایی از بایزین هستند اما در اینجا استفاده میشوند تا یک روش پارامتریک بوت استرپ بسازند، که به سادگی به داده های مستقل از زمان اجازه ی میدهد به حساب آورده شوند.
هر باقیمانده به صورت تصادفی در یک متغیر تصادفی با میانگین صفر و واریانس ۱ ضرب می‌شود. در این متد فرض بر این است که توزیع درست باقی مانده متقارن است و می‌توانند فوایدی برای نمونه گیری ساده روی نمونه‌های کوچک داشته باشد.<ref>Wu, C.F.J. (1986). Jackknife, bootstrap and other resampling methods in regression analysis (with discussions). Annals of Statistics, 14, 1261-1350</ref>
 
=== بوت استرپ ریسکیبلاک (wild)متحرک ===
در این روش n-b+1 بلاک دارای اشتراک و هرکدام به طول b به صورت روبه رو ساخته می‌شوند: مشاهده‌های ۱ تا b می‌شوند بلاک ۱، مشاهده‌های ۲ تا
b+1 می‌شوند بلاک۲ و به همین ترتیب. سپس از این بلاکها n/b باک به صورت تصادفی همراه با جایگذاری انتخاب می‌شوند. سپس مرتب کردن این n/b بلاک به همان ترتیبی که برداشته شده‌اند مشاهده‌های بوت استرپ را می‌دهد. این نوع روش با داده‌های وابسته نیز کار می‌کند اگرچه مشاهده‌ها دیگر با ساختن، ایستا نخواهند بود. اما نشان داده شده‌است که متغیر بودن طول بلاک از این مشکل جلوگیری می‌کند.<ref>Politis, D.N. and Romano, J.P. (1994). The stationary bootstrap. Journal of American Statistical Association, 89, 1303-1313.</ref>
 
== انتخاب آماره- گردان ==
هر باقیمانده به صورت تصادفی در یک متغیر تصادفی با میانگین صفر و واریانس 1 ضرب میشود. در این متد فرض بر این است که توزیع درست باقی مانده متقارن است و میتوانند فوایدی برای نمونه گیری ساده روی نمونه های کوچک داشته باشد.<ref>Wu, C.F.J. (1986). Jackknife, bootstrap and other resampling methods in regression analysis (with discussions). Annals of Statistics, 14, 1261-1350</ref>
در مواقعی که لازم است اطلاعات زیادی از منبع داده استخراج شود، اینکه چه تخمینی یا کدام آماره‌ای مورد نظر بوت استرپینگ است باید مورد توجه قرار گیرد. فرض کنید استنباط میانگین تعدادی مشاهده مورد نیاز است. در این صورت دو امکان موجود است:
* تولید نمونه‌های بوت استرپ از میانگین نمونه‌ای برای ساخت فاصلهٔ اطمینانی برای میانگین
* تولید نمونه‌های بوت استرپ از آمارهٔ جدید (میانگین تقسیم بر انحراف معیار نمونه)، ساخت یک فاصلهٔ اطمینان برای این، سپس فاصلهٔ اطمینان نهایی برای میانگین از ضرب کردن نقاط انتهایی از فاصلهٔ اطمینان اولیه در انحراف معیار نمونه‌ای از نمونهٔ اصلی به دست می‌آید.
 
تایج متفاوت خواهند بود و نتایج شبیه سازی نشان می‌دهند که روش دوم بهتر است. این روش به نوعی می‌تواند از روش پارامتریک استاندارد برای توزیع‌های نرمال منتج شود البته کمی عمومی تر. ایده این است که از یک کمیت محوری(pivotal quantity) استفاده شود، یا اینکه آماره‌ای که تقریبا محوری باشد پیدا شود. همچنین بد نیست که نگاهی به[http://en.wikipedia.org/wiki/Ancillary_statistic Ancillary statistic] هم انداخته شود.
===بوت استرپ بلاک متحرک===
در این روش n-b+1 بلاک دارای اشتراک و هرکدام به طول b به صورت روبه رو ساخته میشوند: مشاهده های 1 تا b میشوند بلاک 1، مشاهده های 2 تا
b+1 میشوند بلاک2 و به همین ترتیب. سپس از این بلاکها n/b باک به صورت تصادفی همراه با جایگذاری انتخاب میشوند. سپس مرتب کردن این n/b بلاک به همان ترتیبی که برداشته شده اند مشاهده های بوت استرپ را میدهد. این نوع روش با داده های وابسته نیز کار میکند اگرچه مشاهده ها دیگر با ساختن، ایستا نخواهند بود.اما نشان داده شده است که متغیر بودن طول بلاک از این مشکل جلوگیری میکند.<ref>Politis, D.N. and Romano, J.P. (1994). The stationary bootstrap. Journal of American Statistical Association, 89, 1303-1313.</ref>
 
== نتیجه گیری فاصله‌های اطمینان از توزیع بوت استرپ ==
==انتخاب آماره- گردان==
راه‌های زیادی برای استفاده از توزیع بوت استرپ در محاسبه فاصلهٔ اطمینان برای آماره‌های شبیه سازی شده وجود دارند و هیچ متدی وجود ندارد که برای تمام مسائل بهترین جواب را بدهد. انتخاب بین سادگی و عمومیت و هدف متدهای تنظیم شده مختلف است که می‌کوشند برای پوشش بیشتر.
در مواقعی که لازم است اطلاعات زیادی از منبع داده استخراج شود، اینکه چه تخمینی یا کدام آماره ای مورد نظر بوت استرپینگ است باید مورد توجه قرار گیرد. فرض کنید استنباط میانگین تعدادی مشاهده مورد نیاز است. در این صورت دو امکان موجود است:
* تولید نمونه های بوت استرپ از میانگین نمونه ای برای ساخت فاصله ی اطمینانی برای میانگین
* تولید نمونه های بوت استرپ از آماره ی جدید (میانگین تقسیم بر انحراف معیار نمونه)، ساخت یک فاصله ی اطمینان برای این، سپس فاصله ی اطمینان نهایی برای میانگین از ضرب کردن نقاط انتهایی از فاصله ی اطمینان اولیه در انحراف معیار نمونه ای از نمونه ی اصلی به دست می آید.
 
=== تاثیر اریبی و فقدان تقارن روی فاصله‌های اطمینان بوت استرپ ===
تایج متفاوت خواهند بود و نتایج شبیه سازی نشان میدهند که روش دوم بهتر است. این روش به نوعی میتواند از روش پارامتریک استاندارد برای توزیع های نرمال منتج شود البته کمی عمومی تر. ایده این است که از یک کمیت محوری(pivotal quantity) استفاده شود، یا اینکه آماره ای که تقریبا محوری باشد پیدا شود. همچنین بد نیست که نگاهی به[http://en.wikipedia.org/wiki/Ancillary_statistic Ancillary statistic] هم انداخته شود.
* '''اریبی''': وقتی که میانگین توزیع بوت استرپ را با آمارهٔ متناظر از توزیع اصلی مقایسه می‌کنیم، در واقع در حال بررسی کردن اریبی هستیم. تا زمانی که توزیع بوت استرپ اریب نباشد و شکلش متقارن باشد درصد فاصله اطمینان راه خوبی برای تخمین زدن است. اریبی در توزیع بوت استرپ منجر به اریبی در تخمین فاصله اطمینان می‌شود.
* '''فقدان تقارن''' در توزیع بوت استرپ موجب به وجود آمدن مسئلهٔ دیگری نیز می‌شود و آن این است که چگونه باید عدم تقارن توزیع در فاصله اطمینان بازتاب داده شود؟
 
==نتیجه= گیریمتدهایی برای فاصله های اطمینان از توزیعاطمینانهای بوت استرپ ===
این متدها شامل متدهای زیر می‌باشند:
* '''بوت استرپ بر حسب درصد'''
* '''بوت استرپ پایه ای'''
* '''بوت استرپ استیودنت شده'''
* '''بوت استرپ اریب-درست شده'''
* '''بوت استرپ تسریع شده'''
 
== مثالهایی از کاربردها ی بوت استرپ ==
راه های زیادی برای استفاده از توزیع بوت استرپ در محاسبه فاصله ی اطمینان برای آماره های شبیه سازی شده وجود دارند و هیچ متدی وجود ندارد که برای تمام مسائل بهترین جواب را بدهد. انتخاب بین سادگی و عمومیت و هدف متدهای تنظیم شده مختلف است که می کوشند برای پوشش بیشتر.
=== کاربردهایی مربوط به تست [http://en.wikipedia.org/w/index.php?title=Mediation_(statistics)&oldid=420102979 Mediation] ===
===تاثیر اریبی و فقدان تقارن روی فاصله های اطمینان بوت استرپ===
بوت استرپینگ یکی از مشهورترین متدهای آزمایش meidation است <ref>Preacher, K. J. , & Hayes, A. F. (2004). SPSS and SAS procedures for estimating indirect effects in simple mediation models. Behavior Research Methods, Instruments, and Computers, 36, 717–731 [http://www.comm.ohio-state.edu/ahayes/sobel.htm Macros for SAS and SPSS]</ref>. زیرا نیاز به فرض نرمال بودن ندارد و بعلاوه از آن می‌توان در مواردی که اندازهٔ نمونه کوچک است استفاده کرد (N < 20).
*'''اریبی''': وقتی که میانگین توزیع بوت استرپ را با آماره ی متناظر از توزیع اصلی مقایسه میکنیم، در واقع در حال بررسی کردن اریبی هستیم. تا زمانی که توزیع بوت استرپ اریب نباشد و شکلش متقارن باشد درصد فاصله اطمینان راه خوبی برای تخمین زدن است. اریبی در توزیع بوت استرپ منجر به اریبی در تخمین فاصله اطمینان میشود.
*'''فقدان تقارن''' در توزیع بوت استرپ موجب به وجود آمدن مسئله ی دیگری نیز میشود و آن این است که چگونه باید عدم تقارن توزیع در فاصله اطمینان بازتاب داده شود؟
 
=== بوت استرپ نرم شده ===
===متدهایی برای فاصله اطمینانهای بوت استرپ===
بوت استرپینگ روشی است که معمولا برای تقریب فاصله اطمینان‌ها برای میانه استفاده می‌شود. اگرچه میانه یک آماره گسسته‌است، و این حقیقت خودش را در توزیع بوت استرپ نشان می‌دهد.
این متدها شامل متدهای زیر میباشند:
*'''بوت استرپ بر حسب درصد'''
*'''بوت استرپ پایه ای'''
*'''بوت استرپ استیودنت شده'''
*'''بوت استرپ اریب-درست شده'''
*'''بوت استرپ تسریع شده'''
 
برای هموار کردن گسستگی میانه، ما می‌توانیم مقدار کمی از ''N''(0, ''σ''<sup>۲</sup>) نویز تصادفی را در هر نمونه بوت استرپ وارد کنیم.
==مثالهایی از کاربردها ی بوت استرپ==
برای نمونه‌ای با اندازهٔ ''n'' انتخاب می‌کنیم <math>\sigma = 1/\sqrt n</math>.
 
هیستوگرام‌های توزیع بوت استرپ و توزیع هموار شدهٔ بوت استرپ در زیر مشخص اند. توزیع بوت استرپ بسیار دندانه دار است زیرا میانه تنها مقادیر کمی را می‌تواند بپذیرد. اما توزیع بوت اترپ نرم شده بر این مشکل غلبه می‌کند.
===کاربردهایی مربوط به تست [http://en.wikipedia.org/w/index.php?title=Mediation_(statistics)&oldid=420102979 Mediation] ===
بوت استرپینگ یکی از مشهورترین متدهای آزمایش meidation است <ref>Preacher, K. J., & Hayes, A. F. (2004). SPSS and SAS procedures for estimating indirect effects in simple mediation models. Behavior Research Methods, Instruments, and Computers, 36, 717–731 [http://www.comm.ohio-state.edu/ahayes/sobel.htm Macros for SAS and SPSS]</ref>. زیرا نیاز به فرض نرمال بودن ندارد و بعلاوه از آن میتوان در مواردی که اندازه ی نمونه کوچک است استفاده کرد (N < 20).
===بوت استرپ نرم شده===
 
بوت استرپینگ روشی است که معمولا برای تقریب فاصله اطمینان ها برای میانه استفاده میشود. اگرچه میانه یک آماره گسسته است، و این حقیقت خودش را در توزیع بوت استرپ نشان میدهد.
 
برای هموار کردن گسستگی میانه، ما میتوانیم مقدار کمی از ''N''(0, ''σ''<sup>2</sup>) نویز تصادفی را در هر نمونه بوت استرپ وارد کنیم.
برای نمونه ای با اندازه ی ''n'' انتخاب میکنیم <math>\sigma = 1/\sqrt n</math>.
هیستوگرام های توزیع بوت استرپ و توزیع هموار شده ی بوت استرپ در زیر مشخص اند. توزیع بوت استرپ بسیار دندانه دار است زیرا میانه تنها مقادیر کمی را میتواند بپذیرد. اما توزیع بوت اترپ نرم شده بر این مشکل غلبه میکند.
 
[[Image:MedianHists.png]]
 
اگرچه توزیع بوت استرپ میانه زشت و به صورت شهودی اشتباه به نظر میرسد،می‌رسد، فاصله هایفاصله‌های اطمینانی که به دست میدهدمی‌دهد در این مثال بد نیستند.
 
== رابطه با دیگر راههای استنباط ==
=== رابطه با دیگر روشهای بازنمونه گیری ===
 
بوت استرپ متمایز شده استشده‌است از:
* پروسه یپروسهٔ جک نایف (jackknife)، استفاده شده برای تخمین اریبی آماره هایآماره‌های نمونه و برای تخمین واریانس.
* وارسی اعتبار (cross-validation)، که در آن پارامترها (مثل وزنهای رگرسیون) در یک زیرنمونه تخمین زده میشوندمی‌شوند و به زیرنمونه هازیرنمونه‌ها تسری داده میشوندمی‌شوند.
برای اطلاعات بیشتر به [http://en.wikipedia.org/w/index.php?title=Resampling_(statistics)&oldid=429554766 Resampling] مراجعه شود.
 
== یو-آماره هاآماره‌ها (U-Statistics) ==
{{Main|U-statistic}}
در مواردی که یک آماره یآمارهٔ مشخص تنها با استفاده از عددی کوچک میتواندمی‌تواند طراحی شود تا یک مشخصه یمشخصهٔ مورد نیاز را اندازه بگیرد، ''r''، از آبتم هایآبتم‌های داده، یک آماره یآمارهٔ متناظر بر اساس تمام نمونه میتواندمی‌تواند فرمول بندی شود. اگر یک r-نمونه از اماره داده شده باشد، میتوانمی‌توان یک n-نمونه از آماره را با روشی شبیه بوت استرپینگ ساخت(با گرفتن میانگین از آماره روی کل زیر نمونه هانمونه‌ها با اندازه یاندازهٔ r). این پروسه به عنوان پروسه ایپروسه‌ای با ویژگیهای خوب شناخته میشودمی‌شود و نتیجه یک U-statistic است. برای r=1 و r=۲، میانگین و واریانس نمونه از این نوع اند.
 
==مبدا این اصطلاح==
 
== مبدا این اصطلاح ==
استفاده از این نام در آمار توسط Bradley Efron در "Bootstrap methods: another look at the jackknife," Annals of Statistics, 7, (1979) 1-26. مراجعه شود به[http://www.economics.soton.ac.uk/staff/aldrich/Mathematical%20Words.htm#boots Notes for Earliest Known Uses of Some of the Words of Mathematics: Bootstrap] (John Aldrich) و[http://jeff560.tripod.com/b.html Earliest Known Uses of Some of the Words of Mathematics (B)] (Jeff Miller) for details.
 
== منابع ==
{{پانویس}}
* {{یادکرد-ویکی|پیوند=http://en.wikipedia.org/w/index.php?title=Bootstrapping_(statistics)&oldid=430891311|عنوان =Bootstrapping_(statistics)|بازیابی =25 می۲۵ ۲۰۱۱می‌۲۰۱۱}}
 
{{آمار}}