هیستوگرام: تفاوت میان نسخه‌ها

محتوای حذف‌شده محتوای افزوده‌شده
جز ویکی‌سازی رباتیک (درخواست کاربر:Freshman404)(۷.۶) >کنترل کیفیت، توزیع نرمال
جز ویرایش به‌وسیلهٔ ابرابزار:
خط ۱:
[[پرونده:Histogram_of_arrivals_per_minute.svg.png|بندانگشتی|بافت‌نگار]]بافت‌نگار نمایشی از توزیع داده‌های کمی پیوسته استپیوسته‌است که می‌تواند تخمینی از [[توزیع احتمال]] باشد و اولین بار توسط [[کارل پیرسون]] به کار گرفته‌شد.<ref>{{یادکرد وب|نویسنده=Pearson, K.|کد زبان=|تاریخ=1895|وب‌گاهوبگاه=royalsocietypublishing.org|نشانی=https://royalsocietypublishing.org/action/captchaChallenge?redirectUrl=https://royalsocietypublishing.org/doi/full/10.1098/rsta.1895.0010&|عنوان=Contributions to the Mathematical Theory of Evolution. II. Skew Variation in Homogeneous Material|doi=10.1098/rsta.1895.0010|بازبینی=2018-12-27}}</ref>بافت‌نگار یکی از 7۷ ابزار [[کنترل کیفیت]] است. تفاوت بافت‌نگار با [[نمودار میله‌ای]] در آن است که نمودار میله‌ای مربوط به توزیع دو [[متغیر تصادفی]] است ولی بافت‌نگار مربوط به یک متغیر است.
 
برای رسم بافت نگار ابتدا باید داده‌ها را به بازه‌های کوچک افراز ( معمولاً طول بازه‌ها برابر در نظر گرفته‌می‌شود. ) ، سپس تعداد داده‌های هر بازه را محاسبه کرد.<ref>{{یادکرد کتاب|نشانی=https://www.worldcat.org/oclc/231881314|عنوان=Introduction to statistics in psychology|نام خانوادگی=Dennis.|نام=Howitt,|تاریخ=2008|ناشر=Financial Times Prentice Hall|شابک=9780132051613|ویرایش=4th ed|مکان=Harlow|oclc=231881314}}</ref>
 
پس از آن اگر طول بازه‌ها برابر بود، روی هر بازه یک مستطیل با ارتفاع متناسب فراوانی آن بازه کشیده می‌شود.
 
اگر طول بازه‌ها برابر نبود، روی هر بازه یک مستطیل با مساحت متناسب فراوانی آن بازه کشیده می‌شود. در این حالت محور عمودی دیگر نشان‌دهنده فراوانی نیست بلکه نشان‌دهنده چگالی فراوانی - تعداد پیشامدها بر واحد متغیر تصادفی روی محور افقی - است.
 
== تعریف ریاضیاتی بافت‌نگار ==
بافت نگار مجموعه‌ای از توابع <math>f_i</math>است که تعداد پیشامدهای مشاهده‌شده از هر بازه را برمی‌گرداند لذا نمودار بافت‌نگار فقط یک راه از نمایش بافت‌نگار است. اگر <math>n</math>تعداد کل پیشامدهای مشاهده‌شده و <math>k</math>تعداد بازه‌ها باشد، آنگاه معادله‌یمعادلهٔ زیر برای بافت‌نگارهای <math>f_i</math>برقرار است:
{{چپ‌چین}}
<math>n = \sum_{i=1}^k f_i</math>
{{پایان چپ‌چین}}
 
=== بافت‌نگار تجمعی ===
[[پرونده:Cumulative_vs_normal_histogram.svg.png|بندانگشتی|بافت‌نگار معمولی و بافت‌نگار تجمعی 10000۱۰۰۰۰ داده با توزیع نرمال استاندارد]]
 
بافت نگار تجمعی مجموعه‌ای از توابع <math>F_i</math>است که [[فراوانی تجمعی]] پیشامدهای مشاهده‌شده هر بازه را برمی‌گرداند پس بافت‌نگار تجمعیِ بافت‌نگار <math>f_i</math>به صورت زیر تعریف می‌شود:
سطر ۲۰ ⟵ ۲۲:
 
=== تعداد و طول بازه‌ها ===
حالت‌های مختلفی برای تعیین بازه‌ها وجود دارد که هرکدام ویژگی‌های مختلفی از داده را آشکار می‌کنند لذا بر همبرهم برتری ندارند. هرچه طول بازه‌ها بیشتر باشد، تراکم نقاط کم‌تر می‌شود و نویز ناشی از نمونه‌گیری تصادفی را کاهش می‌دهد. از طرف دیگر هرچه طول بازه‌ها کمتر باشد، تخمین بهتری از توزیع می‌توان پیدا کرد. بعضی تلاش کرده‌اند تا مقداری بهینه برای تعداد بازه‌ها بیابند ولی این روش‌ها معمولاً شامل فرضی قوی روی توزیع‌اند. با توجه به توزیع واقعی داده‌ها و اهداف تحلیل آن‌ها، مقدار متفاوتی برای طول بازه‌ها مناسب خواهدبود.<ref>{{یادکرد کتاب|نشانی=https://www.worldcat.org/oclc/49312402|عنوان=Modern applied statistics with S|نام خانوادگی=N.)|نام=Venables, W. N. (William|شابک=0387954570|ویرایش=4th ed|مکان=New York|oclc=49312402}}</ref>
 
==== مجذور ====
{{چپ‌چین}}
<math>k = \lceil\sqrt n\rceil</math><ref>{{یادکرد وب|وب‌گاهوبگاه=cameron.econ.ucdavis.edu|نشانی=http://cameron.econ.ucdavis.edu/excel/ex11histogram.html|عنوان=EXCEL Univariate: Histogram|بازبینی=2018-12-27}}</ref>
{{پایان چپ‌چین}}
 
==== فرمول استرجس ====
برای استفاده از فرمول استرجس داده‌ها باید توزیع تقریباً نرمال داشته باشند. معمولاً این فرمول در حالتی که <math>n < 30</math>باشد یا توزیع داده‌ها نرمال نباشد، کاربردی ندارد.<ref>{{یادکرد وب|نویسنده=Sturges, H. A.|کد زبان=|تاریخ=1926|وب‌گاهوبگاه=www.tandfonline.com|نشانی=https://www.tandfonline.com/action/captchaChallenge?redirectUri=/doi/abs/10.1080/01621459.1926.10502161&|ژورنال=Journal of the American Statistical Association|صفحات=65–66|عنوان=The choice of a class interval|doi=10.1080/01621459.1926.10502161|بازبینی=2018-12-27}}</ref>
{{چپ‌چین}}
<math>k = \lceil\log_2n\rceil + 1</math>
سطر ۳۴ ⟵ ۳۷:
==== قانون رایس ====
{{چپ‌چین}}
<math>k = \lceil2\sqrt[3]{n}\rceil</math><ref>{{یادکرد وب|نویسنده=|کد زبان=|تاریخ=|وب‌گاهوبگاه=onlinestatbook.com|نشانی=http://onlinestatbook.com/|فصل="Graphing Distributions"|عنوان=Online Statistics Education: A Multimedia Course of Study|بازبینی=2018-12-27}}</ref>
{{پایان چپ‌چین}}
 
==== فرمول دوآن ====
فرمول دوآن بهبودیافته‌یبهبودیافتهٔ فرمول استرجس است که کابرد فرمول استرجس را برای داده‌های غیرنرمال افزایش داده‌است.
{{چپ‌چین}}
<math>k = 1 + \log_2n + \log_2(1 + \frac{|g_1|}{\sigma_{g_1}})</math>
سطر ۴۵ ⟵ ۴۹:
<math>\sigma_{g_1} = \sqrt\frac{6(n-2)}{(n+1)(n+3)}</math><ref>{{یادکرد ژورنال|نویسنده=Doane DP|عنوان=Aesthetic frequency classification|ژورنال=American Statistician|شماره=30|ناشر=|تاریخ=1976|صفحه=181 - 183|زبان=|شاپا=|doi=|پیوند=|تاریخ دسترسی=}}</ref>
{{پایان چپ‌چین}}
 
==== قانون اسکات ====
{{چپ‌چین}}