نرمال‌سازی (آمار)

نرمال‌سازی (به انگلیسی: normalization) در آمار معانی متفاوتی دارد که ساده‌ترین کاربرد آن نرمال‌سازی داده‌ها یا نرمال‌سازی متغیرها است و عبارت است از روشی که داده‌ها را در زمانی که در یک دامنه نیستند را در دامنه مشابه قرار می‌دهد. به بیان دیگر ممکن است یک داده‌کاو با موقعیت‌هایی مواجه گردد که ویژگیهای در داده شامل مقادیری باشند که در محدوده یا دامنه متفاوتی قرار داشته باشند. این ویژگی‌های با مقادیر بزرگ ممکن است اثر بسیار زیادتری در تابع هزینه نسبت به ویژگی‌های با مقادیر کم داشته باشند. این مشکل با نرمالیزه نمودن ویژگی‌ها طوری که مقادیرشان در دامنه‌های مشابه قرار گیرند برطرف خواهد شد.[۱]

نرمال‌سازی در ساخت مدلویرایش

در ساخت مدل داده‌ها (به انگلیسی: meta model) از روی داده‌ها پیش از شروع آموزش مدل‌ها، داده‌ها را به بزرگترین مقدار متناظرشان تقسیم می‌کنند تا به مقدارهای بین صفر و یک مقیاس (نرمالیزه) شوند این کار باعث می‌شود که اثر مقیاس واقعی (به انگلیسی: Absolute Scale) کمینه شود و همه ورودی‌ها تقریباً در یک دامنه باشند.[۲]

مثالویرایش

در زیر چند روش نرمال‌سازی داده‌ها ارائه می‌گردد.

نام فرمول استفاده
Standard score   نرمال‌سازی خطاها در زمانی که پارامترهای جمعیت شناخته‌شده باشند.
Student's t-statistic   نرمال‌سازی residuals زماین که پارامترهای جمعیت ناشناخته باشند (تخمین)
Studentized residual   نرمال‌سازی در زمانی که متغییرها تخمین زده می‌شوند به خصوص در زمان تحلیل رگرسیون.
Standardized moment   نرمال‌سازی لحظه‌ای به کمک انحراف معیار   به عنوان ابزار اندازه‌گیری مقیاس
ضریب تغییرات   نرمال‌سازی پراکندگی به کمک استفاده از میانگین   به عنوان ابزار اندازه‌گیری مقیاس توزیع نمایی و توزیع پواسون.

منابعویرایش

  1. «پیش‌پردازش داده» (PDF). بایگانی‌شده از اصلی (PDF) در ۲۸ فوریه ۲۰۱۳. دریافت‌شده در ۲۷ نوامبر ۲۰۱۲.
  2. پیش‌بنی ظرفیت باربری شمع‌های تحت اثر بار محوری به کمک ماشین بردار پشتیبان، علیرضا کردجزی، فریدون پویانژاد