تنظیم تیخونوف

تنظیم تیخونوف، که به نام آندره تیخونوف نامگذاری شده‌است، روشی برای منظم‌سازی در مسئله کمترین مربعات است.[۱] این روش معمولاً در مدلهایی که تعداد زیادی پارامتر دارند خوب عمل می‌کند. به‌طور کلی، این روش در ازای مقدار قابل اغماضی از اریبی، باعث بهبود بازدهی برآورد پارامتر می‌شود.[۲]

تعریف ریاضیویرایش

کمترین مربعاتویرایش

در مسئله کمترین مربعات هدف یافتن بردار   است به قسمی که   به کمترین مقدار ممکن برسد. در اینجا   یک ماتریس   ،   و   بردارهای   هستند و  . برای پیداکردن بهینه تابع، گرادیان   را حساب کرده با صفر برابر می‌کنیم. نخست   را بسط می‌دهیم:

 

حال گرادیان این تابع را نسبت به   پیدا می‌کنیم که می‌شود:

 

با برابر قرار دادن گرادیان با صفر پارامتر بهینه بدست می‌آید:

 

تنظیم تیخونوفویرایش

یکی از مشکلات اساسی که در این روش کمترین مربعات وجود دارد مشکل عدم وجود ماتریس وارون برای   است. برای حل این مشکل تنظیم تیخونوف تابع   را به تابع پایین تغییر می‌دهد:[۲][۳]

 

حال گرادیان این تابع را نسبت به   پیدا می‌کنیم که می‌شود:

 

با برابر قرار دادن گرادیان با صفر پارامتر بهینه بدست می‌آید:

 

پس پارامتر بهینه ما برابر است با:

 

رگرسیون ستیغیویرایش

اگر   را با   (در اینجا   ماتریس همانی است) برابر قرار دهیم، به جواب پایین می‌رسیم که همان رگرسیون ستیغی است. در این رگرسیون سعی بر این است که مقادیر پارامتر زیاد بزرگ نشود تا بیش‌برازش اتفاق نیفتد. با استفاده از ضریب لاگرانژ می‌توان نشان داد که این روش معادل بهینه‌سازی   تحت محدودیتِ   به ازای یک عدد   است.[۴]

 

جستارهای وابستهویرایش

منابعویرایش

  1. Kennedy, Peter (2003). A Guide to Econometrics (Fifth ed.). Cambridge: The MIT Press. pp. 205–206. ISBN 0-262-61183-X.
  2. ۲٫۰ ۲٫۱ Gruber, Marvin (1998). Improving Efficiency by Shrinkage: The James–Stein and Ridge Regression Estimators. Boca Raton: CRC Press. pp. 7–15. ISBN 0-8247-0156-9.
  3. Golub, Gene H.; Hansen, Per Christian.; O'Leary, Dianne P. (1999-01-01). "Tikhonov Regularization and Total Least Squares". SIAM Journal on Matrix Analysis and Applications. 21 (1): 185–194. doi:10.1137/S0895479897326432. ISSN 0895-4798.
  4. Ng, Andrew Y. (2004). Feature selection, L1 vs. L2 regularization, and rotational invariance (PDF). Proc. ICML.