یادگیری با نظارت: تفاوت میان نسخه‌ها

محتوای حذف‌شده محتوای افزوده‌شده
جز ویکی‌سازی رباتیک (درخواست کاربر:Freshman404)(۷.۶) >یادگیری تحت نظارت، یادگیری ماشین، آزمون و خطا، میوه ها، داده ها+نشانی+املا (۱۰.۷)
Mostafa abdi (بحث | مشارکت‌ها)
جزبدون خلاصۀ ویرایش
خط ۲:
{{یادگیری ماشین}}
''' یادگیری با نظارت''' یا '''یادگیری تحت نظارت''' {{به انگلیسی|Supervised learning}} یکی از زیرمجموعه‌های [[یادگیری ماشینی]] است.
بگذارید با یک مثال عمومی وارد این بحث شویم. یک میوه فروشی را در نظر بگیرید که تمام [[میوه ها]] را بصورت کاملاً جدا از هم مرتب کرده است و شما نوع میوه را کاملاً می دانید، یعنی زمانی که یک میوه را در دست می گیرید به نام نوشته شده در قفسه ی آن نگاه می کنید و در میابید که مثلاً سیب است و اصطلاحاً می گویند تمام [[داده ها]] تگ گذاری شده هستند. به طبع فردی از قبل دسته ی داده ها را مشخص کرده است. حال اگر با دید موجودی در حال یادگیری به ماجرا نگاه کنیم، انتظار می رود فرضاً مفهومی از سیب ها را یاد بگیرد و احتمالاً در آینده نیز اگر تصویری از سیب ها دید آن را تشخیص دهد. <ref>{{یادکرد وب|کد زبان=fa|تاریخ=|وب‌گاه=|نشانی=https://mimland.com/هوش_مصنوعیهوش-مصنوعی/|عنوان=هوش مصنوعی چیست؟ مقدمه ای برای شروع هوش مصنوعی}}</ref> این مثال می تواند شروع خوبی از [[یادگیری تحت نظارت]] باشد.
 
این روش ، یک روش عمومی در [[یادگیری ماشین]] است که در آن به یک سیستم، مجموعه ای از جفت‌های ورودی – خروجی ارائه شده و سیستم تلاش می‌کند تا تابعی از ورودی به خروجی را فرا گیرد. یادگیری تحت نظارت نیازمند تعدادی داده ورودی به منظور آموزش سیستم است. با این حال رده‌ای از مسائل وجود دارند که خروجی مناسب که یک سیستم یادگیری تحت نظارت نیازمند آن است، برای آن‌ها موجود نیست. این نوع از مسائل چندان قابل جوابگویی با استفاده از یادگیری تحت نظارت نیستند. یادگیری تقویتی مدلی برای مسائلی از این قبیل فراهم می‌آورد. در یادگیری تقویتی<ref>Reinforcement Learning</ref>، سیستم تلاش می‌کند تا تقابلات خود با یک محیط پویا را از طریق [[آزمون و خطا]] بهینه نماید. یادگیری تقویتی مسئله‌ای است که یک عامل که می‌بایست رفتار خود را از طریق تعاملات آزمون و خطا با یک محیط پویا فرا گیرد، با آن مواجه است. در یادگیری تقویتی هیچ نوع زوج ورودی- خروجی ارائه نمی‌شود. به جای آن، پس از اتخاذ یک عمل، حالت بعدی و پاداش بلافصل به عامل ارائه می‌شود. هدف اولیه برنامه‌ریزی عامل‌ها با استفاده از تنبیه و تشویق است بدون آنکه ذکری از چگونگی انجام وظیفه آن‌ها شود.