واریانس: تفاوت میان نسخهها
محتوای حذفشده محتوای افزودهشده
بدون خلاصۀ ویرایش |
جز ویرایش بهوسیلهٔ ابرابزار: |
||
خط ۴:
'''واریانس''' یا '''وردایی''' عددی است که نشان میدهد چگونه یک سری داده حول [[مقدار میانگین]] پخش میشوند. برای تعریف وردایی اگر فرض کنیم که متغیر تکی <math>X</math> دارای توزیع <math>p(x)</math> است و متوسط توزیع جمعیت آن را با <math>\mu</math> نشان دهیم آنگاه وردایی این جمعیت به صورت زیر تعیین میشود:
{{وسطچین}}
<math>Var(X) = \sigma^{2} \equiv \left\langle (X-\mu)^{2} \right\rangle </math>
{{پایان}}
حال اگر یک توزیع مجزا داشته باشیم که هر مجموعه داده در آن، دارای [[احتمال]] <math>p(x)</math> باشد، وردایی به صورت زیر محاسبه میشود:
{{وسطچین}}
<math>\sigma^{2} = \sum_{i=1}^{N}p(x_{i})(x_{i} - \mu)^{2}</math>
{{پایان}}
اما در بیشتر موارد توزیع حاکم بر دادهها مشخص نیست در این حالت وردایی را به صورت زیر تخمین میزنیم:
{{وسطچین}}
<math>S^{2}_{N}\equiv \frac{1}{N}\sum_{i=1}^{N}(x_{i}-\overline{x})^{2}</math>
{{پایان}}
در این رابطه <math>\overline{x}</math> [[میانگین]] ([[امید ریاضی]]) دادههاست که خود از رابطهٔ زیر حساب میشود:
{{وسطچین}}
:<math>\overline{x} = \frac{1}{N}\sum_{i=1}^N x_i = \frac{x_1+x_2+\cdots+x_N}{N}</math>
{{پایان}}
البته باید توجه داشت که تخمین فوق یک تخمین دقیق و بدون خطا برای وردایی نیست لذا برای از بین بردن این خطا در تخمین از وردایی تصحیح شدهاستفاده میکنیم که بصورت زیر تعریف میگردد
{{وسطچین}}
<math>S^{2}_{N-1}\equiv \frac{1}{N-1}\sum_{i=1}^{N}(x_{i}-\overline{x})^{2}</math>
{{پایان}}
== تعریف ==
اگر <math>\mu= \operatorname{E}(X)</math>، [[امید ریاضی]] ([[میانگین]]) [[متغیر تصادفی]] X باشد، آنگاه وردایی X برابر خواهد بود با:
{{وسطچین}}
:<math>\begin{align}\operatorname{Var}(X)
&= \operatorname{E}[(X - \mu)^2] \\&= \operatorname{E}[X^2 - 2\mu X + \mu^2] \\
&= \operatorname{E}[X^2] - 2\mu\,\operatorname{E}[X] + \mu^2 \\&= \operatorname{E}[X^2] - 2\mu^2 + \mu^2 \\&= \operatorname{E}[X^2] - \mu^2 \\&= \operatorname{E}[X^2] - (\operatorname{E}[X])^2.
\end{align}</math>
=== حالت گسسته ===
اگر <math>X</math>یک متغیر تصادفی با [[تابع جرم احتمال]] به این شکل باشد <math>x_1 \mapsto p_1, x_2 \mapsto p_2, \ldots, x_n \mapsto p_n</math> آنگاه واریانس آن به این شکل محاسبه میشود.
{{وسطچین}}
: <math>\operatorname{Var}(X) = \sum_{i=1}^n p_i\cdot(x_i - \mu)^2,</math>
{{پایان}}
عبارت پیشین با معادله پایین معادل است:
{{وسطچین}}
: <math>\operatorname{Var}(X) = \left(\sum_{i=1}^n p_i x_i ^2\right) - \mu^2,</math>
{{پایان}}
در اینجا <math>\mu </math> [[امید ریاضی]] <math>X</math> است.
{{وسطچین}}
: <math>\mu = \sum_{i=1}^n p_i x_i. </math>
{{پایان}}
واریانس <math>n</math>مقدار که از لحاظ احتمال با یکدیگر برابرند با عبارت پایین برابر خواهد بود:
{{وسطچین}}
: <math> \operatorname{Var}(X) = \frac{1}{n} \sum_{i=1}^n (x_i - \mu)^2, </math>
{{پایان}}
در اینجا <math>\mu</math> میانگین <math>n</math>
{{وسطچین}}
: <math>\mu = \frac{1}{n}\sum_{i=1}^n x_i .</math>
{{پایان}}
البته واریانس این <math>n</math> داده را بدون در نظرگرفتن میانگین آنها هم
{{وسطچین}}
: <math> \operatorname{Var}(X) = \frac{1}{n^2} \sum_{i=1}^n \sum_{j=1}^n \frac{1}{2}(x_i - x_j)^2 = \frac{1}{n^2}\sum_i \sum_{j>i} (x_i-x_j)^2. </math>
{{پایان}}
=== حالت پیوسته ===
{{وسطچین}}
:<math>\begin{align}
\operatorname{Var}(X) = \sigma^2 &= \int (x-\mu)^2 f(x) \, dx \\[4pt]
خط ۷۶:
&= \int x^2 \,dF(x) - \mu^2,
\end{align}</math>
{{پایان}}
و
{{وسطچین}}
:<math>\mu = \int x \, f(x) \, dx\,, </math>
{{پایان}}
== خواص ==
خط ۸۸:
:<math>\operatorname{Var}(aX+bY)=a^2\operatorname{Var}(X)+b^2\operatorname{Var}(Y)+2ab\, \operatorname{Cov}(X,Y),</math>
==
فرهنگستان زبان فارسی، '''وردیدن''' از ریشه باستانی ورت (ورتیدن)، را بجای فعل to varry برگزیده است و از این فعل مشتقات '''[[وردایی]]''' (variance)،'''وردش''' (variation)، '''وردا''' (variant)، [[هموردا]] (covariant)، [[هم وردایی]] (covariannce)، [[ناوردا]] (invariant)، [[ناوردایی]] (invariance)، [[پادوردا]] (contravariance) را برساخته است.
== تخمین وردایی یک تابع ==
{{وسطچین}}
<math>\operatorname{Var}\left[f(X)\right]\approx \left(f'(\operatorname{E}\left[X\right])\right)^2\operatorname{Var}\left[X\right]</math>
{{پایان}}
== جستارهای وابسته ==
|