درخت تصمیم: تفاوت میان نسخه‌ها

محتوای حذف‌شده محتوای افزوده‌شده
برچسب‌ها: متن دارای ویکی‌متن نامتناظر ویرایشگر دیداری
برچسب‌ها: متن دارای ویکی‌متن نامتناظر ویرایشگر دیداری
خط ۶۵:
</math> از یک دسته داشته باشند، یعنی در هر کدام از این دو گِرِه دو نوع دسته نداشته باشیم. برای رگرسیون این ناخالصی می تواند واریانس متغیر وابسته باشد. از آنجا که مقدار داده در <math>Q_{left}(\theta)
</math> و <math>Q_{right}(\theta)
</math> با هم متفاوت است میانگینی وزن‌دار از هر دو ناخالصی به شکل پایین محاسبه می‌کنیم،<ref name=":1">{{یادکرد کتاب|نشانی=https://dl.acm.org/citation.cfm?id=2755359|عنوان=Data Mining With Decision Trees: Theory and Applications|نام خانوادگی=Rokach|نام=Lior|نام خانوادگی۲=Maimon|نام۲=Oded|تاریخ=2014|ناشر=World Scientific Publishing Co., Inc.|شابک=9789814590075|ویرایش=2nd|مکان=River Edge, NJ, USA}}</ref> در این معادله <math>N_m = |Q|
</math>، <math>n_{left} = |Q_{left}(\theta)|
</math> و <math>n_{right} = |Q_{right}(\theta)|
</math>:
</math><ref name=":1">{{یادکرد کتاب|نشانی=https://dl.acm.org/citation.cfm?id=2755359|عنوان=Data Mining With Decision Trees: Theory and Applications|نام خانوادگی=Rokach|نام=Lior|نام خانوادگی۲=Maimon|نام۲=Oded|تاریخ=2014|ناشر=World Scientific Publishing Co., Inc.|شابک=9789814590075|ویرایش=2nd|مکان=River Edge, NJ, USA}}</ref>:
 
<math>G(Q, \theta) = \frac{n_{left}}{N_m} H(Q_{left}(\theta))