ویکیپدیا:گزیدن مقالههای خوب/رگرسیون خطی
رگرسیون خطی
ویرایشمشکلات مقاله مرتفع شد و شرایط خوبیدگی را دارد. — حجت/بحث ۱۹ سپتامبر ۲۰۱۹، ساعت ۲۳:۴۹ (UTC)
- بحث زیر بسته شده است. لطفاً آن را تغییر ندهید. ادامهٔ دیدگاهها باید در صفحهٔ بحث مناسب ثبت شوند. نباید ویرایش دیگری در این ریسه انجام شود.
ویرایش ورودیها | |||
---|---|---|---|
اندازهٔ مقاله | ۱۱۳٬۳۲۳ | ||
آیا مقاله ترجمه از ویکیهای دیگر است؟ | تا حدودی | ||
املا و انشای خوب | |||
دیباچهٔ مناسب | |||
منبعدارکردن همهٔ مطالب | |||
یادکرد صحیح منابع | |||
جایگزینی منابع نامعتبر (بهخصوص منابع ویکیایی) با منابع معتبر | |||
بررسی حق نشر (متن و پروندهها) | |||
جعبهٔ اطلاعات و/یا جعبهٔ گشتن مناسب | |||
رده و میانویکی مناسب | |||
تصویر(های) مناسب | |||
پیوند به محتوا(ها)ی مرتبط در پروژههای خواهر | |||
پیوند پایدار منابع برخط | بهزودی انجام میشود | ||
هنوز ناظر وپ:گمخ صحت ورودیها را تأیید نکردهاست. |
نامزدکننده: Tarikhejtemai (بحث • مشارکتها) ۱۸ مهٔ ۲۰۱۹، ساعت ۲۳:۴۷ (UTC)
خسته نباشید. چند نکته در بررسی اولیه:
- قبل از معرفی رگرسیون خطی لازم است در بخشی همهٔ مفاهیم توضیح داده شوند (مدل آماری، رگرسیون، ضریب همبستگی، چرا اسمش رگرسیون خطی است و..) بخش تاریخچه را هم از پایین مقاله بردارید و در این بخش ادغام کنید. تفاوت رگرسیون و همبستگی هم جایش این جاست.
- به پیشفرضهای بنیادین تحلیل رگرسیون خطی اشارهای نشده. بخشی با این عنوان بعد از بخش مفاهیم بسازید.
- جای بخشی برای کاربردها خالی است. (در آمار، علوم کامپیوتر، اقتصاد، پزشکی و ...)
- لید هم خیلی کوتاه است و موضوع را معرفی نمیکند. فکر کنید در این بخش قرار است کل مقاله را برای یک دانشآموز دبیرستانی خلاصه کنید. سعی کنید دستکم دو بند باشد. معمولا نیازی به منبع گذاشتن در این بخش هم نیست. برای نمونه مقالهٔ انگلیسی en:Linear regression را نگاه کنید.
- عنوان بخشها را لینک نکنید، به جایش میتوانید زیر آنها از الگوهای {{اصلی}} و {{مرتبط}} استفاده کنید.
- فرمولها درازند و از صفحه بیرون میزنند. هر کدام را در دو سه خط بشکنید. برای شکستن اول بعد از تگ math بنویسید \begin{align} و قبل از بستن تگ math بنویسید \end{align} و در جای مناسب (مثلا قبل از علامت مساوی) با گذاشتن \\ فرمول را بشکنید.
- به تجربهٔ من بهترین شکل گذاشتن فرمولها در وب فارسی به شکل {{وسطچین}} شده است. برای مثال بیضی را ببینید.
- معادل انگلیسی عبارات را در {{یاد}} بگذارید، بعد پایین صفحه قبل یک بخش یادداشتها درست کنید و الگوی {{یادداشت}} را زیرش بگذارید.
- منابع انگلیسی را چپچین کنید (برای اینکار تگ ref منابع انگلیسی را به صورت
<ref dir='ltr'>
بنویسید) - منبع شماره ۴ (کریمی فر، ۱۳۸۷) به صورت کوتاه آمده، این کار مال وقتی است که در انتهای مقاله فهرست منابعی باشد.
- اگر مورد دیگری به ذهنم رسید خدمتان عرض میکنم.—N
ightD ۲۰ مهٔ ۲۰۱۹، ساعت ۱۵:۵۵ (UTC)- @Nightdevil: عزیز، خیلی ممنون برای توضیحات مفیدی که در بالا فرمودید، در عرض چند روز آینده همه را در مقاله اعمال میکنم. با سپاس فراوان Tarikhejtemai (بحث) ۲۱ مهٔ ۲۰۱۹، ساعت ۰۳:۴۶ (UTC)
- @Nightdevil: ، مواردی که در بالا فرموده بودید را اعمال کردم، خوشحال میشوم اگر دوباره یک نگاهی بیاندازید، با سپاس فراوان Tarikhejtemai (بحث) ۲۲ مهٔ ۲۰۱۹، ساعت ۰۵:۱۲ (UTC)
- @Tarikhejtemai: دستتان درد نکند. بهنظرم از نظر ساختاری مشکل دیگری ندارد. تا چند روز آینده از نظر املایی و انشایی بررسی میکنم.—N
ightD ۲۴ مهٔ ۲۰۱۹، ساعت ۱۶:۰۹ (UTC)
- @Tarikhejtemai: دستتان درد نکند. بهنظرم از نظر ساختاری مشکل دیگری ندارد. تا چند روز آینده از نظر املایی و انشایی بررسی میکنم.—N
- نظر حجت
من راستش نظر راجع به این مقاله زیاد دارم؛ خواهشمندم که کم صبر کنید تا دستهبندیاش کنم و ثبت کنم. به نظر من مقاله کمی کار دارد تا خوبیده بشود.
عجالتاً تغییراتی که در دیباچه دادم را ببینید (چند ویرایش اخیر)؛ پیوند کردن واژههای تخصصی به مقالهٔ مرتبط یکی از کارهای مهمی است که به قدر کفایت انجام نشده. رسم بر این است که در دیباچه یک بار پیوند صورت بگیرد، و در باقی مقاله هم در اولین کاربردش باز پیوند صورت بگیرد (مثلاً «مدل آماری» یکبار در دیباچه و یکبار در بخش مفاهیم پیوند بشود). این را لطفاً در باقی مقاله انجام بدهید تا من به بررسی خودم ادامه میدهم — حجت/بحث ۲۵ مهٔ ۲۰۱۹، ساعت ۱۶:۳۰ (UTC)
- اشارهای به مفهوم رگرسیون خطی ساده (en:simple linear regression) و رگرسیون خطی چندگانه (multiple linear regression) نشدهاست و تفاوت آن با رگرسیون چندمتغیره نیز بحث نشدهاست. این تفاوت یکی از رایجترین سردرگمیهای افرادی است که با رگرسیون تازه آشنا شدهاند یا درست آن را فرانگرفتهاند.
- مفهوم «خطی» بودن رگرسیون به خوبی شرح داده نشدهاست. شایسته است که مقالهٔ en:Linear predictor function هم ساخته بشود و به آن ارجاع بشود. به رابطه خطی هم ارجاع شده اما به نظر من آن پیوند مناسبی نیست و این که معرفی کردم مناسبتر خواهد بود. کلاً هم یکی دو جمله راجع به این که «رابطه خطی» یعنی چه در مقاله باید شرح داده بشود. اشارهای به این که خط در ابعاد بالاتر به صورت صفحه و فراصفحه (هایپر پلین) نمایش مییابد هم مفید است.
- مفهومهای «پارامتر» و «داده» نیاز به پیوند شدن دارند.
- رگرسیون خطی فقط این چیزی که در مقاله شرح داده شده (و متمرکز بر تخمین «میانگین» متغیر وابسته است) نیست؛ رگرسیونهای متمرکز بر تخمین میانه و غیره هم داریم.
- جملهٔ آخر پاراگراف دوم لید مقالهٔ ویکیپدیای انگلیسی به نظر من خیلی مهم است (این که همهٔ مدلهای رگرسیونی روی توزیع احتمال شرطی کار میکنند و نه توزیع احتمال توأم). پیوندهایی به این توزیعها هم در جای مناسب باید اضافه بشود.
- بخش تاریخچه به شوخی شبیه است :) این و خیلی منابع دیگر به راحتی در دسترس هستند تا تاریخچه را کامل کنید.
- روشهای محاسبهای که در مقاله آمده، در دیباچه خوب معرفی نشدهاند. من باز روشی که در پاراگراف آخر نسخهٔ ویکیپدیای انگلیسی آمده را بیشتر میپسندم.
- بخشهایی با نام «تفاوت رگرسیون و همبستگی براساس هدف:» و «تفاوت رگرسیون و همبستگی براساس روش:» هست که باید تبدیل به یک زیربخش (با دستور
=== تفاوت رگرسیون و همبستگی براساس هدف ===
) بشوند؛ شاید بد نباشد که هر دو تبدیل به یک بخش بشوند با نام «تفاوت رگرسیون و همبستگی». - این که «خطی» به معنای خط راست نیست باز یکی از کجفهمیهای رایج است. من مثالی که در ویکیپدیای انگلیسی برای روابط خطی از نوع چندجملهای درجهٔ سوم (cubic polynomial) زده و تصویر هم گذاشته که خواننده ببیند خط مذکور خط راست نیست را دوست دارم و به نظرم اینجا باید اضافه بشود.
- پیشفرضها فقط بر شمرده شده اما توضیح داده نشده. هر پیشفرض باید توضیح داده بشود (امیدوارم از مثال زدن از مقالهٔ ویکیپدیای انگلیسی خسته نشده باشید؛ در این زمینه هم بهتر عمل کرده!)
- بخشی برای تحلیل نتایج مدل رگرسیون (interpretation) باید اختصاص یابد.
- بخش سوم و چهارم مقاله در حالت فعلی، باید برود ذیل یک عنوان «تخمین پارامترها». روشهای تخمین دیگری نیز رایج است (مثل Least-angle regression یا Quantile regression که برایشان مقاله نداریم) که باید اشاره بشوند.
- اشارهای به تعمیمات رگرسیون خطی (و طبعاً مدل خطی تعمیمیافته) باید بشود.
- بخش کاربردها به شدت کوتاه است.
- محدودیتهای روش رگرسیون خطی شرح داده نشده. همان پیوند قبلی شروع خوبی است.
موضوع خوبی را انتخاب کردید، اما مقاله هنوز خیلی کار دارد. — حجت/بحث ۲۵ مهٔ ۲۰۱۹، ساعت ۱۸:۰۸ (UTC)
- @Huji: ، خیلی ممنون برای نظرات بالا و تغییر بعضی اصطلاحات در دیباچه. بسیاری از قسمتهای مقاله از دید یادگیری ماشین نوشته شدهاند نه مباحث سنتی آماری، مانند گرادیان کاهشی تصادفی، یا تنظیم مدل که نسبتا مباحث جدیدی هستند. از این رو برای انسجام بیشتر مقاله سعی کردم که تمام مقاله بیشتر با اصطلاحات یادگیری ماشین پیش برود ولی شاید بشود که هر دو را در مقاله گنجاند. در مورد تاریخچه یک منبع پیدا کردم که اولین استفاده از رگرسیون خطی را به دو قرن پیش نسبت میداد، آیا شما منابع دیگری سراغ دارید که اطلاعات بیشتری در این زمینه ارائه بدهد؟ در زمینه کاربردها هم به علت فراوانی و گستردگیشان نمیدانم کدامیک را در مقاله ذکر کنم. بزودی بر روی سایر موارد بالا کار میکنیم. با سپاس Tarikhejtemai (بحث) ۲۷ مهٔ ۲۰۱۹، ساعت ۱۸:۳۹ (UTC)
- @Tarikhejtemai: یادگیری ماشینی فقط یکی از کاربردهای رگرسیون خطی است و اساساً هم یک علم کاربردی است (در حالی که علم آمار، علمی که در آن رگرسیون خطی شکل گرفت، یک علم پایهای است. برای تکمیل این مقاله بهتر است از کتابهای آمار استفاده کنید، نه کتابهای یادگیری ماشینی.
- منبعی که گفته تاریخچهٔ رگرسیون خطی به دو دهه قبل بر میگردد را همانجا دور بیندازید! سابقهٔ خود یادگیری ماشینی بیش از دو دهه است، رگرسیون که به کنار! اولین تلاشها در راستای ایجاد مدلهای رگرسیون خطی را به فرانسیس گالتون (درگذشتهٔ ۱۹۱۱ میلادی) نسبت میدهند (مثالی از یک منبع در همین خصوص) که یعنی قدمت این روش آماری به بالای صد سال میرسد. — حجت/بحث ۲۷ مهٔ ۲۰۱۹، ساعت ۱۸:۴۸ (UTC)
- @Huji: در مورد تاریخچه منظورم دو قرن بود، اشتباها دودهه نوشتم (پیشبینی حرکت سیارات توسط گاوس)، ممنون برای منبع بالاTarikhejtemai (بحث) ۲۷ مهٔ ۲۰۱۹، ساعت ۱۸:۵۳ (UTC)
- @Tarikhejtemai: دو قرن منطقیتر است (اگر چه کمی از آن طرف پشت بام افتاده). — حجت/بحث ۲۷ مهٔ ۲۰۱۹، ساعت ۱۹:۱۱ (UTC)
- @Huji: در مورد تاریخچه منظورم دو قرن بود، اشتباها دودهه نوشتم (پیشبینی حرکت سیارات توسط گاوس)، ممنون برای منبع بالاTarikhejtemai (بحث) ۲۷ مهٔ ۲۰۱۹، ساعت ۱۸:۵۳ (UTC)
- وضعیت مقاله
- @Huji: سلام. بررسی این مقاله به کجا رسیده است؟ mOsior (بحث) ۳۰ ژوئیهٔ ۲۰۱۹، ساعت ۱۶:۵۶ (UTC)
- منتظر هستم که کاربر:Tarikhejtemai موارد بالا را انجام بدهند، جلوی هر کدام که کامل شد یک بزنند و من را خبر کنند — حجت/بحث ۳۰ ژوئیهٔ ۲۰۱۹، ساعت ۱۶:۵۸ (UTC)
- @MOSIOR: @Huji: موارد بالا را تا یک هفته دیگر انجام خواهم داد، ممنون از پیگیری. Tarikhejtemai (بحث) ۳۰ ژوئیهٔ ۲۰۱۹، ساعت ۱۹:۲۹ (UTC)
- @Huji: جان، اکثر موارد بالا را انجام دادم و در خلاصه ویرایشها به آنها اشاره کردم و در بالا تیک زدم. چند مورد باقیمانده را این هفته تکمیل خواهم کرد، ممنون Tarikhejtemai (بحث) ۵ اوت ۲۰۱۹، ساعت ۱۶:۴۱ (UTC)
- @Tarikhejtemai: کارتان که کامل شد من را آگاه کنید — حجت/بحث ۵ اوت ۲۰۱۹، ساعت ۱۸:۲۱ (UTC)
- @Huji: جان، موارد بالا را انجام دادم. فقط برای قسمت کاربدها چون با محدودیت ها ادغام شده و محدودیت ها به کاربرد رگرسیون در علوم انسانی اشاره میکند مطلب دیگری به آن اضافه نکردم، ممنون Tarikhejtemai (بحث) ۱۳ اوت ۲۰۱۹، ساعت ۲۳:۵۰ (UTC)
- @Tarikhejtemai: ممنون بابت آگاهسازی. عجالتاً دیباچه را باید به روز کنید تا خلاصهای از آنچه راجع به کاربردها و محدودیتها افزودید در آن منعکس شده باشد. من هم مقاله را یک بار دیگر میخوانم. — حجت/بحث ۱۴ اوت ۲۰۱۹، ساعت ۰۱:۰۱ (UTC)
- همچنین «جریمه» و «نرم» باید در دیباچه پیوند بشوند (و در اولین کاربردشان در ادامهٔ متن هم پیوند بشوند. اما در پیودن کردن افراط نکنید؛ من چندین پیوند تکراری را برداشتم.) — حجت/بحث ۱۴ اوت ۲۰۱۹، ساعت ۱۵:۲۶ (UTC)
- بله حتما، ممنون برای یادآوریTarikhejtemai (بحث) ۱۴ اوت ۲۰۱۹، ساعت ۱۷:۰۸ (UTC)
- @Huji: جان، موارد بالا را انجام دادم. فقط برای قسمت کاربدها چون با محدودیت ها ادغام شده و محدودیت ها به کاربرد رگرسیون در علوم انسانی اشاره میکند مطلب دیگری به آن اضافه نکردم، ممنون Tarikhejtemai (بحث) ۱۳ اوت ۲۰۱۹، ساعت ۲۳:۵۰ (UTC)
- @Tarikhejtemai: کارتان که کامل شد من را آگاه کنید — حجت/بحث ۵ اوت ۲۰۱۹، ساعت ۱۸:۲۱ (UTC)
- بررسی دور دوم
چندین اشکال انشایی را خودم برایتان حل کردم چون زحمتش کمتر از این بود که اینجا بنویسم و شما حل کنید. با توجه به میزان دخالتی که در مقاله داشتهام خوب است که شخص ثالثی هم این گمخ را بررسی کند و توسط من بسته نشود.
این موارد را هم حتماً در نظر بگیرید:
- برای رگرسیون چندک، رگرسیون لارس و رگرسیون خطی تعمیمیافته در انتهای بخش مربوط به هر کدام یکی دو جمله اضافه کنید که کاربردشان چیست. اگر فقط کاربرد را در چارچوب مفاهیم شرح بدهید (مثلاً «رگرسیون خطی تعمیمیافته را میتوان زمانی به کار برد که رابطهٔ بین متغیر وابسته و مستقل یک خط راست نباشد اما بتوان از طریق یک انگاشت آن را به خطی راست تبدیل کرد؛ مثلاً اگر رابطهٔ بین متغیر وابسته با یک متغیر مستقل رابطهٔ نمایی باشد میتوان با کمک یک چندجملهای درجهٔ دوم این رابطه را خطی کرد») کافی است اما اگر مثال واقعی از دنیای بیرون ارائه کنید بهتر هم هست (مثلاً در مورد روابط نمایی، سرعت رشد و تقسیم باکتریها مثال خوبی است). بدیهی است که منبع هم باید بیاورید.
- یک برچسب {{مدرک}} و یک برچسب {{کدام}} در مقاله زدم که باید اصلاح کنید.
- فرمولها را در حد سواد خودم چک کردم و درست به نظر میرسند اما اگر یک نفر دیگر هم بررسی کند عالی میشود. متوجهم که پیدا کردن شخص ثالث ممکن است دشوار باشد.
- تصویری که برای رگرسیون لارس گذاشتید، توضیح بیشتری میطلبد. خطها چه چیزی را نشان میدهند؟ بد نیست که تصویر را کمی بزرگتر کنید که خواناتر بشود و لازم است که توضیحات زیرش هم را گسترش بدهید.
- تنها بخشی که هنوز جایش خالی است بحث «عیبیابی مدل رگرسیونی» است (en:Regression diagnostic که شامل بررسی q-q plot و شاخصهایی مثل Cook's D و اینها میشود). این را میشود گذاشت برای برگزیدگی اما اگر به صورت مختصر اشاره کنید ایدئال خواهد بود.
در کل مقاله را خیلی دوست دارم. — حجت/بحث ۱۴ اوت ۲۰۱۹، ساعت ۲۳:۳۳ (UTC)
- خیلی ممنون برای فیدبکهای بالا، تا چند روز آینده روی این چند مورد کار خواهم کرد. Tarikhejtemai (بحث) ۱۵ اوت ۲۰۱۹، ساعت ۲۱:۵۱ (UTC)
- @Huji: جان این چند مورد بالا را هم انجام دادم. برای چک کردن نهائی فرمولها آیا خود شما شخصی را در نظر دارید؟ Tarikhejtemai (بحث) ۱۸ اوت ۲۰۱۹، ساعت ۲۳:۴۰ (UTC)
- @Nightdevil: شما میتوانید فرمولها را بررسی کنید؟ — حجت/بحث ۱۸ اوت ۲۰۱۹، ساعت ۲۳:۴۸ (UTC)
- با عرض معذرت از تاخیر، تا فردا بررسی میکنم.—N
ightD ۲۵ اوت ۲۰۱۹، ساعت ۱۷:۲۱ (UTC)
- با عرض معذرت از تاخیر، تا فردا بررسی میکنم.—N
- @Nightdevil: شما میتوانید فرمولها را بررسی کنید؟ — حجت/بحث ۱۸ اوت ۲۰۱۹، ساعت ۲۳:۴۸ (UTC)
@Huji و Nightdevil: سلام. کار بررسی این مقاله به کجا رسید؟--سید (بحث) ۳۰ اوت ۲۰۱۹، ساعت ۰۴:۰۳ (UTC)
- @Nightdevil: عزیز، میخواستم بپرسم فرصت کردید فرمولها را چک کنید؟ پیشاپیش ممنون از وقت و زحمتتان. Tarikhejtemai (بحث) ۸ سپتامبر ۲۰۱۹، ساعت ۲۱:۰۵ (UTC)
باز هم شرمنده از تاخیر، روش تنظیم را متاسفانه هرچه خواندم نفهمیدم، ولی فرمولهای بخشهای دیگر را چک کردم و مشکلی ندیدم جز این چند نکته:
- تخمین پارامترها> رگرسیون خطی ساده
- «در این روش پارامترها را با کمینهکردن تابع زیر به دست میآورند:» بنویسید «تابع زیر» چیست (مجموع مربعات خطا)
- «در مورد رگرسیون ساده، پارامترها با این روش برابر خواهند بود با:» بازهٔ عملگرهای سیگمای صورت و مخرج را بنویسید (i=1 تا N)
- در عبارت دوم (y-b1xb1) یک b1 زیادی است.
- رگرسیون خطی چندگانه>صورت مسئله
- «ورودی چند متغیره هست» > چند متغیره است
- «ترکیبی خطی از بردارد ورودی» > بردار
- رگرسیون خطی چندگانه>کمترین مربعات
- جواب دو بار تکرار شده. —N
ightD ۱۹ سپتامبر ۲۰۱۹، ساعت ۰۲:۵۰ (UTC)
- @Huji و Nightdevil: خیلی ممنون بابت فیدبکهای بالا، همه موارد اصلاح شد. Tarikhejtemai (بحث) ۱۹ سپتامبر ۲۰۱۹، ساعت ۱۹:۴۰ (UTC)
- بحث بسته شده است. لطفاً آن را تغییر ندهید. ادامهٔ دیدگاهها باید در صفحهٔ بحث مناسب ثبت شوند. نباید ویرایش دیگری در این ریسه انجام شود.