متغیرهای وابسته و مستقل: تفاوت میان نسخه‌ها

محتوای حذف‌شده محتوای افزوده‌شده
FreshmanBot (بحث | مشارکت‌ها)
جز اصلاح فاصله مجازی + اصلاح نویسه با استفاده از AWB
خط ۱۲:
در ابزارهای [[داده کاوی]]، (برای [[آمار چندمتغیره|آمار چند متغیره]](multivariate statistics) و [[یادگیری ماشینی]] (machine learning)) متغیر وابسته در ''نقشی'' به عنوان '''متغیر هدف''' '''(target variable)''' اختصاص یافته؛ (یا در بعضی ابزارها به عنوان ''label attribute'') در حالی که یک متغیر وابسته می‌تواند نقش یک ''متغیر منظّم'' ''(regular variable)'' را داشته باشد.<ref>[http://1xltkxylmzx3z8gd647akcdvov.wpengine.netdna-cdn.com/wp-content/uploads/2013/10/rapidminer-5.0-manual-english_v1.0.pdf English Manual version 1.0] for [[RapidMiner]] 5.0, October 2013.</ref> مقادیر شناخته شده برای متغیر هدف برای مجموعه training data و مجموعه داده آزمایشی (Test data)ارائه شده است، اما باید برای برای داده‌های دیگر پیش‌بینی شده باشد. دادهٔ هدف در الگوریتم‌های [[یادگیری با نظارت]] (supervised learning) به کار می‌روند، امّا در یادگیری بدون نظارت(non-supervised learning) به کار نمی‌روند.
 
=== مدل سازیمدل‌سازی ===
در [[مدل (ریاضی)|مدل سازیمدل‌سازی ریاضی]]، متغیر وابسته، برای بررسی کمی و کیفی تغییرات آن به هنگام تغییرات متغیرهای مستقل مطالعه می‌شود. به عنوان نمونه، در مدل خطی [[تصادفی]] {{چر}}<math>y_i = a + bx_i + e_i\ </math>، عبارت <math>y_i</math>،{{رچ}} ''i''امین مقدار از متغیر وابسته است و عبارت <math>x_i</math>،{{رچ}} ''i''امین مقدار از متغیر مستقل است. عبارت <math>e_i</math> به عنوان ''خطا'' شناخته می‌شود و شامل تغییراتی از متغیر وابسته است، که به وسیلهٔ متغیر مستقل توضیح داده نمی‌شود. با متغیرهای مستقل چندگانه، عبارت به این صورت است: <math>y_i = a + bx_1 + bx_2 + ... + bx_n + e_i\ </math>، که در آن ''n'' تعداد متغیرهای مستقل است.
 
=== شبیه‌سازی ===
خط ۳۵:
 
اگر متغیرهای Extraneous، به عنوان متغیر مستقل، مشمول یک [[تحلیل رگرسیون|رگرسیون]] (regression) باشند، ممکن است با برآورد دقیق پارامتر پاسخ، [[پیش بینی]](prediction)، و [[نیکویی برازش]] (goodness of fit)، به محقق کمک کنند، بدون توجه ذاتی به [[فرضیه]] ی تحت آزمایش. برای مثال، در یک مطالعه آزمایشی، برای تأثیر تحصیلات دانشگاهی بر درآمدهای دوران زندگی، تعدادی از متغیرهای تصادفی می‌تواند جنسیت، قومیت، طبقهٔ اجتماعی، ژنتیک، هوش، سن، و غیره باشد.
یک متغیر، extraneous است، تنها زمانی که به طوربه‌طور مفروض (یا طوری کهطوری‌که نشان داده شده باشد) بتواند بر متغیر وابسته تأثیر بگذارد. اگر مشمول رگرسیون (regression) باشد، می‌تواند تناسب مدل را بهبود بخشد. اگر مشمول رگرسیون نباشد، و یک [[کوواریانس]] (covariance) غیر صفر به همراه یک یا چند متغیر مستقل دلخواه داشته باشد حذف آن، نتیجه رگرسیون را برای تأثیر آن متغیر مستقل دلخواه، [[سوگیری]](bias)خواهد کرد.
این اثر [[اختلاط]] (confounding) یا [[اریب متغیرهای حذف‌شده|سوگیری متغیرهای حذف شده]](omitted variable bias)نامیده می‌شود؛ درایندر این موارد، تغییر طراحی و/یا کنترل آماری فرایندها (statistical control) لازم است.
 
متغیرهای Extraneous معمولاً به سه نوع طبقه‌بندی می‌شوند:
خط ۴۳:
# متغیرهای موقعیتی(Situational variables) شامل مشخصات محیطی هستند که مطالعه یا تحقیق در آن انجام شده است؛ و آن ویژگی‌ها در نتجهٔ آزمایش تأثیر منفی دارد. مثل دمای هوا، سطح فعالیت، روشنایی، و زمان.
 
در شبه تجربی (quasi-experiments)، تفاوت گذاریتفاوت‌گذاری میان متغیر وابسته و سایر متغیرها ممکن است در مقایسه با تفاوت گذاریتفاوت‌گذاری میان متغیرهایی که می‌توانند به وسیلهٔ محقق تغییر کنند یا آن‌ها که نمی‌توانند، کم‌اهمیت جلوه کنند. متغیرها در شبه تجربی (quasi-experiments)، ممکن است به عنوان متغیر extraneous، متغیرهای موضوعی (subject variables)، متغیرهای آزمایشی (experimental variables)، متغیرهای وضعیتی (situational variables)، متغیرهای شبه مستقل (pseudo-independent variables)، متغیرهای پس-رویدادی (pseudo-independent variables)، متغیرهای گروهی طبیعی (natural group variables)، یا متغیرهای دستکاری نشده(non-manipulated variables) رجوع داده شده باشند.
 
در مدل سازی، تغییرپذیری پوشش داده نشده به وسیلهٔ متغیر توضیحی به وسیلهٔ <math>e_i</math> طراحی شده؛ و به عناوین «باقیمانده»(residual)، اثر جانبی(side effect)، خطا(error)، اشتراک گذاریاشتراک‌گذاری غیرقابل توضیح(unexplained share)، متغیر باقیمانده(residual variable)، یا تلورانس(tolerance)شناخته شده.
 
== مثال‌ها ==
* تأثیرات ویتامین C بر طول عمر
در یک مطالعه برای بررسی اینکه آیا مصرف یک حب قرص ویتامین C در هر روز، طول عمر افراد را زیاد می‌کند، یا خیر؛ محققان طی مدتی، برای گروهی از مردم ویتامین C تجویز می‌کنند. یک قسمت از آن گروه هر روز قرص واقعی ویتامین C را دریافت می‌کنند؛ و قسمت باقی‌مانده از اعضای گروه قرصی بی اثربی‌اثر و نمایشی را. هیچ‌کدام از اعضای گروه نمی‌داند که جزو کدام دسته است. محققان میزان طول عمر را در هر دو گروه بررسی می‌کنند. اینجا، متغیّر وابسته طول عمر است و متغیّر مستقل یک [[دستگاه اعداد دودویی|متغیّر دو وضعیتی]](binary) برای استفاده، یا عدم استفاده از ویتامین C.
* تأثیر کوددهی بر رشد گیاه
در یک مطالعه برای اندازه‌گیری تفاوت مقدار کوددهی، بر رشد گیاه، متغیّر مستقل می‌تواند مقدار کود استفاده شده باشد. متغیّر وابسته می‌تواند رشد، در ارتفاع یا جرم گیاه باشد. متغیّرهای تحت کنترل می‌توانند نوع گیاه، نوع کود، میزان نور دریافتی گیاه، اندازه خاک، و غیره باشد.