واریانس: تفاوت میان نسخه‌ها

محتوای حذف‌شده محتوای افزوده‌شده
بدون خلاصۀ ویرایش
جز ویرایش به‌وسیلهٔ ابرابزار:
خط ۴:
 
'''واریانس''' یا '''وردایی''' عددی است که نشان می‌دهد چگونه یک سری داده حول [[مقدار میانگین]] پخش می‌شوند. برای تعریف وردایی اگر فرض کنیم که متغیر تکی <math>X</math> دارای توزیع <math>p(x)</math> است و متوسط توزیع جمعیت آن را با <math>\mu</math> نشان دهیم آنگاه وردایی این جمعیت به صورت زیر تعیین می‌شود:
{{وسط‌چین}}
<center>
<math>Var(X) = \sigma^{2} \equiv \left\langle (X-\mu)^{2} \right\rangle </math>
{{پایان}}
</center>
 
حال اگر یک توزیع مجزا داشته باشیم که هر مجموعه داده در آن، دارای [[احتمال]] <math>p(x)</math> باشد، وردایی به صورت زیر محاسبه می‌شود:
{{وسط‌چین}}
<center>
<math>\sigma^{2} = \sum_{i=1}^{N}p(x_{i})(x_{i} - \mu)^{2}</math>
{{پایان}}
</center>
 
اما در بیشتر موارد توزیع حاکم بر داده‌ها مشخص نیست در این حالت وردایی را به صورت زیر تخمین می‌زنیم:
 
{{وسط‌چین}}
<center>
<math>S^{2}_{N}\equiv \frac{1}{N}\sum_{i=1}^{N}(x_{i}-\overline{x})^{2}</math>
{{پایان}}
</center>
در این رابطه <math>\overline{x}</math> [[میانگین]] ([[امید ریاضی]]) داده‌هاست که خود از رابطهٔ زیر حساب می‌شود:
{{وسط‌چین}}
<center>
:<math>\overline{x} = \frac{1}{N}\sum_{i=1}^N x_i = \frac{x_1+x_2+\cdots+x_N}{N}</math>
{{پایان}}
</center>
البته باید توجه داشت که تخمین فوق یک تخمین دقیق و بدون خطا برای وردایی نیست لذا برای از بین بردن این خطا در تخمین از وردایی تصحیح شده‌استفاده می‌کنیم که بصورت زیر تعریف می‌گردد
{{وسط‌چین}}
<center>
<math>S^{2}_{N-1}\equiv \frac{1}{N-1}\sum_{i=1}^{N}(x_{i}-\overline{x})^{2}</math>
{{پایان}}
</center>
 
== تعریف ==
اگر <math>\mu= \operatorname{E}(X)</math>، [[امید ریاضی]] ([[میانگین]]) [[متغیر تصادفی]] X باشد، آنگاه وردایی X برابر خواهد بود با:
{{وسط‌چین}}
<center>
:<math>\begin{align}\operatorname{Var}(X)
&= \operatorname{E}[(X - \mu)^2] \\&= \operatorname{E}[X^2 - 2\mu X + \mu^2] \\
&= \operatorname{E}[X^2] - 2\mu\,\operatorname{E}[X] + \mu^2 \\&= \operatorname{E}[X^2] - 2\mu^2 + \mu^2 \\&= \operatorname{E}[X^2] - \mu^2 \\&= \operatorname{E}[X^2] - (\operatorname{E}[X])^2.
\end{align}</math>
</center>{{پایان}}برای به خاطر سپردن راحت‌تر این فرمول گفته‌می‌شود وردایی برابر است با «[[میانگین]] مجذور، منهای مجذور میانگین». وردایی متغیر تصادفی ''X'' را معمولاً با Var(''X''){{چر}} یا <math>\scriptstyle\sigma_X^2</math> یا به صورت ساده‌تر σ<sup>2</sup> (تلفظ می‌شود [[سیگما]]-دو) نمایش می‌دهند.
 
=== حالت گسسته ===
اگر <math>X</math>یک متغیر تصادفی با [[تابع جرم احتمال]] به این شکل باشد <math>x_1 \mapsto p_1, x_2 \mapsto p_2, \ldots, x_n \mapsto p_n</math> آنگاه واریانس آن به این شکل محاسبه می‌شود.
{{وسط‌چین}}
<center>
: <math>\operatorname{Var}(X) = \sum_{i=1}^n p_i\cdot(x_i - \mu)^2,</math>
{{پایان}}
</center>
 
عبارت پیشین با معادله پایین معادل است:
{{وسط‌چین}}
<center>
: <math>\operatorname{Var}(X) = \left(\sum_{i=1}^n p_i x_i ^2\right) - \mu^2,</math>
{{پایان}}
</center>
 
در اینجا <math>\mu </math> [[امید ریاضی]] <math>X</math> است.
{{وسط‌چین}}
<center>
: <math>\mu = \sum_{i=1}^n p_i x_i. </math>
{{پایان}}
</center>
 
واریانس <math>n</math>مقدار که از لحاظ احتمال با یکدیگر برابرند با عبارت پایین برابر خواهد بود:
{{وسط‌چین}}
<center>
: <math> \operatorname{Var}(X) = \frac{1}{n} \sum_{i=1}^n (x_i - \mu)^2, </math>
{{پایان}}
</center>
 
در اینجا <math>\mu</math> میانگین <math>n</math>داده استداده‌است:
{{وسط‌چین}}
<center>
: <math>\mu = \frac{1}{n}\sum_{i=1}^n x_i .</math>
{{پایان}}
</center>
 
البته واریانس این <math>n</math> داده را بدون در نظرگرفتن میانگین آنها هم می شودمی‌شود به شکل پایین محاسبه کرد: <ref>{{cite conference|authors=Yuli Zhang, Huaiyu Wu, Lei Cheng|date=June 2012|title=Some new deformation formulas about variance and covariance|conference=Proceedings of 4th International Conference on Modelling, Identification and Control(ICMIC2012)|pages=987–992}}</ref>
{{وسط‌چین}}
<center>
: <math> \operatorname{Var}(X) = \frac{1}{n^2} \sum_{i=1}^n \sum_{j=1}^n \frac{1}{2}(x_i - x_j)^2 = \frac{1}{n^2}\sum_i \sum_{j>i} (x_i-x_j)^2. </math>
{{پایان}}
</center>
 
=== حالت پیوسته ===
{{وسط‌چین}}
<center>
:<math>\begin{align}
\operatorname{Var}(X) = \sigma^2 &= \int (x-\mu)^2 f(x) \, dx \\[4pt]
خط ۷۶:
&= \int x^2 \,dF(x) - \mu^2,
\end{align}</math>
{{پایان}}
</center>
و
{{وسط‌چین}}
<center>
:<math>\mu = \int x \, f(x) \, dx\,, </math>
{{پایان}}
</center>
 
== خواص ==
خط ۸۸:
:<math>\operatorname{Var}(aX+bY)=a^2\operatorname{Var}(X)+b^2\operatorname{Var}(Y)+2ab\, \operatorname{Cov}(X,Y),</math>
 
== واژه شناسیواژه‌شناسی ==
فرهنگستان زبان فارسی، '''وردیدن''' از ریشه باستانی ورت (ورتیدن)، را بجای فعل to varry برگزیده است و از این فعل مشتقات '''[[وردایی]]''' (variance)،'''وردش''' (variation)، '''وردا''' (variant)، [[هم‌وردا]] (covariant)، [[هم وردایی]] (covariannce)، [[ناوردا]] (invariant)، [[ناوردایی]] (invariance)، [[پادوردا]] (contravariance) را برساخته است.
 
== تخمین وردایی یک تابع ==
{{وسط‌چین}}
<center>
<math>\operatorname{Var}\left[f(X)\right]\approx \left(f'(\operatorname{E}\left[X\right])\right)^2\operatorname{Var}\left[X\right]</math>
{{پایان}}
</center>
 
== جستارهای وابسته ==