درخت تصمیم: تفاوت میان نسخهها
محتوای حذفشده محتوای افزودهشده
برچسبها: متن دارای ویکیمتن نامتناظر ویرایشگر دیداری |
برچسبها: متن دارای ویکیمتن نامتناظر ویرایشگر دیداری |
||
خط ۶۵:
</math> از یک دسته داشته باشند، یعنی در هر کدام از این دو گِرِه دو نوع دسته نداشته باشیم. برای رگرسیون این ناخالصی می تواند واریانس متغیر وابسته باشد. از آنجا که مقدار داده در <math>Q_{left}(\theta)
</math> و <math>Q_{right}(\theta)
</math> با هم متفاوت است میانگینی وزندار از هر دو ناخالصی به شکل پایین محاسبه میکنیم،<ref name=":1">{{یادکرد کتاب|نشانی=https://dl.acm.org/citation.cfm?id=2755359|عنوان=Data Mining With Decision Trees: Theory and Applications|نام خانوادگی=Rokach|نام=Lior|نام خانوادگی۲=Maimon|نام۲=Oded|تاریخ=2014|ناشر=World Scientific Publishing Co., Inc.|شابک=9789814590075|ویرایش=2nd|مکان=River Edge, NJ, USA}}</ref> در این معادله <math>N_m = |Q|
</math>، <math>n_{left} = |Q_{left}(\theta)|
</math> و <math>n_{right} = |Q_{right}(\theta)|
</math>:
<math>G(Q, \theta) = \frac{n_{left}}{N_m} H(Q_{left}(\theta))
|