درخت تصمیم: تفاوت میان نسخه‌ها

محتوای حذف‌شده محتوای افزوده‌شده
برچسب‌ها: متن دارای ویکی‌متن نامتناظر ویرایشگر دیداری
برچسب‌ها: متن دارای ویکی‌متن نامتناظر ویرایشگر دیداری
خط ۸۲:
</math> انجام می‌دهیم. معیاری که برای تبدیل یک گره به برگ از آن استفاده می‌کنیم می‌تواند حداقل تعداد داده در یک گره و یا عمق درخت باشد. معمولا این دو پارامتر باعث تنظیم مدل (Regularization) می‌شود.
 
=== مسئله دسته‌بندی ===
اگر مسئله ما دسته‌بندی باشد و <math>y_i \in [1,\cdots, K]
</math> باشد تابع ناخالصی برای گره <math>Q
</math>میتواند یکی از موارد پایین باشد، در این معادله‌ها <math>p_{mk} = 1/ N_m \sum_{(x_i, y_i) \in Q} I(y_i = k)
 
</math>:
 
ناخالصی گینی: <math>H(Q) = \sum_k p_{mk} (1 - p_{mk})
 
</math>
 
ناخالصی آنتروپی: <math>H(Q) = - \sum_k p_{mk} \log(p_{mk})
 
</math>
 
ناخالصی خطا: <math>H(Q) = 1 - \max(p_{mk})
</math>
 
=== مسئله رگرسیون ===
<br />