داده‌های پانلی: تفاوت میان نسخه‌ها

محتوای حذف‌شده محتوای افزوده‌شده
Gholamimahdi (بحث | مشارکت‌ها)
بدون خلاصۀ ویرایش
Ebrambot (بحث | مشارکت‌ها)
جز ربات: اصلاح ترکیبی
خط ۱:
در [[آمار]] و [[اقتصاد سنجی|اقتصاد سنجی]]، مجموعه داده هايهای پانليپانلی شامل مشاهداتيمشاهداتی برايبرای چندينچندین بخش(خانوار،بنگاه و...) ميمی باشند که در طيطی زمان هايهای مختلف جمع آوريآوری شده اند. يعنيیعنی يکیک [[مدل]] داده هايهای پانل حاويحاوی اطلاعاتياطلاعاتی در زمان و مکان است که شامل N مؤلفه در T دوره زمانيزمانی ميمی باشد. <br />
 
اگر تعداد مشاهدات زمانيزمانی برايبرای تمام مؤلفه هايهای موجود در پانل يکسانیکسان باشد، به آن پانل متوازن(Balancd Panel) گفته ميمی شود. اما در صورتيصورتی که مشاهدات مفقوده ايای برايبرای تعداديتعدادی از مؤلفه ها وجود داشته باشد، پانل را نامتوازن ميمی ناميمنامیم.<br />
 
 
 
== مزايايمزایای داده هايهای پانل ==
1- محققينمحققین ميمی توانند از داده هايهای پانليپانلی برايبرای موارديمواردی که مسائل را نمينمی توان صرفا به صورت [[سری زمانی]] يایا برشهايبرشهای [[مقطعی]] بررسيبررسی کرد، بهره گيرندگیرند. مثلا در بررسيبررسی [[تابع تولید]] مساله ايای که وجود دارد ايناین است که بتوان تغييراتتغییرات تکنولوژيکتکنولوژیک را از صرفه هايهای به مقياسمقیاس تفکيکتفکیک کرد. در ايناین گونه موارد داده هايهای مقطعيمقطعی فقط اطلاعاتياطلاعاتی را در مورد صرفه هايهای به مقياسمقیاس فراهم ميمی آورد. در حاليحالی که داده هايهای سريسری زمانيزمانی اثرات هردو را بدون هيچهیچ گونه تفکيکيتفکیکی نشان ميمی دهد. تلفيقتلفیق داده هايهای سريسری زمانيزمانی با داده هايهای مقطعيمقطعی نه تنها ميمی تواند اطلاعات سودمنديسودمندی را برايبرای تخمينتخمین مدلهايمدلهای [[اقتصادسنجی]] فراهم آورد، بلکه بر مبنايمبنای نتايجنتایج بدست آمده ميمی توان استنباط هايهای سياستگزاريسیاستگزاری در خور توجهيتوجهی نيزنیز به عمل آورد.<br />
 
2- داده هايهای پانليپانلی حاويحاوی اطلاعات بيشتر،بیشتر، تنوع گسترده تر و [[هم خطی]] کمتر ميانمیان متغيرهامتغیرها بوده و در نتيجهنتیجه کاراتر ميمی باشند. در حاليکهحالیکه در سريهايسریهای زمانيزمانی هم خطيخطی بيشتريبیشتری را بينبین متغيرهامتغیرها مشاهده ميمی کنيمکنیم. با توجه به اينکهاینکه داده هايهای پانليپانلی ترکيبيترکیبی از سريسری هايهای زمانيزمانی و مقطعيمقطعی ميمی باشد، بعد مقطعيمقطعی موجب اضافه شدن تنوع زياديزیادی شده و در نتيجهنتیجه برآوردهايبرآوردهای معتبرتريمعتبرتری را ميمی توان انجام داد. در اينجااینجا تعداد مشاهدات ما به NT افزايشافزایش يافتهیافته که منجر به برآوردهايبرآوردهای کاراتريکاراتری از متغيرهامتغیرها ميمی شود.ايناین امر را ميمی توان در محاسبه [[واریانس]] جامعه مشاهده کرد. در داده های سری زمانی این واریانس به صورت σ^2=σ2/N-K محاسبه می شود ولی در داده های پانلی به صورت σ^2=σ2/NT-N-K قابل محاسبه است. چون مخرج کسر دوميدومی بزرگتر از کسر اولياولی است، پس واريانسواریانس داده هايهای پانليپانلی کمتر بوده و بنابراينبنابراین تخمينتخمین کاراتريکاراتری خواهد داشت.<br />
 
3- داده هايهای پانليپانلی امکان طراحيطراحی الگوهايالگوهای رفتاريرفتاری پيچيدهپیچیده تريتری را فراهم ميمی کنند.<br />
 
4- داده هايهای پانليپانلی امکان بيشتريبیشتری را برايبرای شناساييشناسایی و اندازه گيريگیری اثراتياثراتی فراهم ميمی کنند که با اتکای صرف به آمارهايآمارهای مقطعيمقطعی يایا سريسری زمانيزمانی به سادگيسادگی قابل شناساييشناسایی نيستندنیستند.<br />
 
== روشهايروشهای تخمينتخمین مدل ==
نمونه مدليمدلی که برايبرای توضيحتوضیح رفتار متغيرهامتغیرها در ايناین نوع داده ها ميمی توان ساخت به صورت زيرزیر است: <br />
 
<math>Y_{it} = \alpha_{i} + \beta' X_{it} + u_{it}.</math>
 
که در آن β يکیک بردار k*1 از پارامترها، <math>X_{it}</math> يکیک بردار k*1 از مشاهدات مربوط به متغيرهايمتغیرهای توضيحي،توضیحی، t=1,2,...,T و i=1,2,...,N است. همچنينهمچنین فرض بر ايناین است که جمله اخلال يکیک [[نوفه سفید]] (white noise) است.<br />
 
دو شيوهشیوه مختلف برايبرای تخمينتخمین ايناین معادله وجود دارد. نخست مدل اثرات ثابت كهکه در آن <math>\alpha_{i}</math> ها N پارامتر نامعلوم وليولی ثابت هستند و ديگريدیگری مدل اثرات تصادفيتصادفی كهکه در آن عرض از مبدا ثابت نبوده و تصادفيتصادفی است و همچنينهمچنین مستقل از متغيرهايمتغیرهای توضيحيتوضیحی ميمی باشد.
=== مدل اثرات ثابت ===
در ايناین مدل هر يکیک از مولفه ها يکیک مقدار ثابت مخصوص به خود دارد و به دليلدلیل آنکه برايبرای کار کردن با هر يکیک از ايناین مقاديرمقادیر ثابت، يکیک [[متغیر مجازی]] دز نظر گرفته ميمی شود، تخمينتخمین زن اثرات ثابت، تخمينتخمین زن متغيرهايمتغیرهای مجازيمجازی حداقل مربعات(LSDV) نيزنیز ناميدهنامیده ميمی شود. ايناین مدل را ميمی توان به شکل زيرزیر نوشت:<br />
 
<math>Y =D \alpha + X \beta + u.</math> که در آن D ماتريسماتریس متغيرهايمتغیرهای مجازيمجازی با ابعاد NT*N. و X ماتريسماتریس متغيرهايمتغیرهای توضيحيتوضیحی با ابعاد NT*k. و β نيزنیز ماتريسماتریس ضرايبضرایب با ابعاد k*1 ميمی باشند. <br />
 
مدل اخيراخیر يکیک مدل رگرسيونيرگرسیونی کلاسيککلاسیک بوده و هيچهیچ شرط جديديجدیدی برايبرای تجزيهتجزیه و تحليلتحلیل آن لازم نيستنیست و ميمی توان مدل را با استفاده از OLS برآورد کرد.<br />
 
مزيتمزیت مدل با اثرات ثابت ايناین است که ميمی تواند اثراتياثراتی را که در هر يکیک از مؤلفه ها متفاوت است وليولی در طول زمان تغييرتغییر نمينمی کند، نشان دهد. البته پس از تشکيلتشکیل مدل ديگردیگر نمينمی توان به آن متغيريمتغیری افزود که در طول زمان تغييرتغییر نکند، چرا که با اثرات ثابت موجود همخطيهمخطی کامل پيداپیدا خواهد کرد. از سويسوی ديگردیگر عيبعیب چنينچنین مدليمدلی ايناین است که در آن بايدباید برايبرای هريکهریک از متغيرهايمتغیرهای مجازيمجازی يکیک ضريبضریب و در مجموع N ضريبضریب تخمينتخمین زد. ايناین امر هنگاميهنگامی که تعداد مؤلفه ها يعنيیعنی N خيليخیلی زيادزیاد باشد، که معمولا نيزنیز چنينچنین است، مسئله ساز خواهد شد.<br />
 
برايبرای برطرف کردن ايناین مشکل يکیک راه آن است که ميانگينمیانگین زمانيزمانی هر يکیک از متغيرهامتغیرها را از مقدار اصلياصلی آنها کم کنيمکنیم. با ايناین کار به مدليمدلی ميمی رسيمرسیم که فاقد عرض از مبدأ خواهد بود و ميمی توانيمتوانیم روش حداقل مربعات معموليمعمولی رابرايرابرای آن اجرا کنيمکنیم که مراحل تکنیکی آن در زیر آورده شده است:<br />
<math>y_{it}-\overline{y_{i}}=\left(X_{it}-\overline{X_{i}}\right) \beta+\left( u_{it}-\overline{u_{i}}\right)</math>
where <math>\overline{X_{i}}=\frac{1}{T}\sum\limits_{t=1}^{T}X_{it}</math> and <math>\overline{u_{i}}=\frac{1}{T}\sum\limits_{t=1}^{T}u_{it}</math>.<br />
خط ۴۱:
<math>\widehat{y}_{it}=y_{it}-\overline{y_{i}}</math><br />
 
روش ديگردیگر آن است که تفاضل مرتبه اول متغيرهامتغیرها را به جايجای آنها در مدل به کار ببريمببریم. درايندراین صورت نيزنیز عرض از مبدأ از مدل حذف ميمی شود و مشکل تعداد زيادزیاد پارامترها برايبرای تخمينتخمین نيزنیز برطرف ميمی گردد:<br />
<math>y_{it}-y_{it-1}=\left( X_{it}
-X_{it-1}\right) \beta+\left( u_{it}-u_{it-1}\right) </math><br />
خط ۵۰:
<math>\widehat{y}_{it}=y_{it}-y_{it-1}</math><br />
 
=== مدل اثرات تصادفيتصادفی ===
يکیک روش جايگزينجایگزین برايبرای تخمينتخمین مدل اثرات ثابت، تخمينتخمین مدل اثرات تصادفيتصادفی است. تفاوت چنينچنین مدليمدلی با اثرات ثابت ايناین است که در آن عرض از مبدأ مختص هر يکیک از متغيرهامتغیرها مقاديرمقادیر ثابتيثابتی نيستند،نیستند، بلکه به صورت تصادفيتصادفی انتخاب ميمی شوند. لذا مقدار <math>\alpha_{i}</math> در مدل کليکلی برابر است با <math>\alpha_{it} = \mu_i + \nu_{it}.</math> که در آن <math>\nu_{i}</math> يکیک متغيرمتغیر تصادفيتصادفی نوفه سفيدسفید با ميانگينمیانگین صفر و واريانسواریانس <math> \sigma^2_{\nu}</math>است. يکیک فرض مهم ايناین است که متغيرمتغیر <math>\nu_{i}</math> بايدباید مستقل از متغيرهايمتغیرهای توضيحيتوضیحی و اجزاياجزای خطايخطای <math>u_{i}</math> باشد. اگر <math>\nu_{i}</math> ها با متغيرهايمتغیرهای توضيحيتوضیحی همبسته باشند، آنگاه تخمينتخمین زن هايهای اریب و ناسازگاريناسازگاری بدست خواهند آمد. از سويسوی ديگردیگر مزيتمزیت ايناین مدل بر مدل اثرات ثابت آن است که تعدادپارامترهايتعدادپارامترهای کمتريکمتری بايدباید تخمينتخمین زده شود.<br />
 
فرم کليکلی چنينچنین مدليمدلی به صورت روبرو ميمی باشد: <br />
 
<math>Y_{it} =\mu + \beta' X_{it} + v_{i} + u_{it}.</math>
 
برايبرای تخمينتخمین ايناین مدل بايدباید توجه داشت که در ايناین حالت واريانسواریانس هايهای مربوط به مقاطع مختلف با هم يکسانیکسان نبوده و مدل ما دچار [[واریانس ناهمسانی]] ميمی باشد که بايدباید از با استفاده از برآوردگر GLS آن را تخمین زد. به صورت زیر:<br />
:<math>\widehat{\beta}=(X'\Omega^{-1} X)^{-1}(X'\Omega^{-1}Y)\,</math>
:<math>\widehat{\Omega}=\Iota \otimes \Sigma\,</math><br />
که در آن <math>\Sigma</math> واریانس <math>u_{it}</math> و <math>\Iota</math> ماتریس واحد و <math>\Omega</math> ماتریس واریانس-کوواریانس می باشد.<br />
 
با معرفيمعرفی ايناین دو روش سؤاليسؤالی که پيشپیش ميمی آيدآید ايناین است که در عمل ما بايستيبایستی کداميککدامیک از روشهايروشهای مذکور را استفاده کنيمکنیم. برايبرای تصميمتصمیم گيريگیری از آزمون هاسمن کمک ميمی گيريمگیریم.
 
== آزمون هاسمن ==
برايبرای آنکه بتوانيمبتوانیم بينبین مدلهايمدلهای اثرات ثابت و اثرات تصادفيتصادفی از نظر قدرت توضيحتوضیح دهندگيدهندگی متغيرمتغیر وابسته مقايسهمقایسه ايای انجام دهيم،دهیم، از آزمونيآزمونی به نام '''آزمون هاسمن''' استفاده ميمی کنيمکنیم. از آنجا که برايبرای انجام مقايسهمقایسه بينبین ايناین دو مدل بايدباید وجود همبستگيهمبستگی بينبین اثرات تصادفيتصادفی(<math>\alpha_{i}</math> ) و رگرسورها را مورد آزمون قرار دهيم،دهیم، لذا در آزمون هاسمن فرضيهفرضیه صفر ايناین است که هيچهیچ همبستگيهمبستگی ميانمیان اثرات تصادفيتصادفی و رگرسورها وجود ندارد. تحت ايناین فرضيه،فرضیه، تخمينتخمین زن هايOLSهایOLS وGLS هر دو سازگار هستند وليولی تخمينتخمین زن OLS ناکاراست. در شرايطيشرایطی که تحت فرضيهفرضیه مقابل، تخمينتخمین زن OLS کارا و سازگار وليولی تخمينتخمین زن GLS ناسازگار است.<br />
 
[[آماره]] ايناین آزمون به صورت زيرزیر است: <br />
<math>H=(b_{1}-b_{0})'(\operatorname{Var}(b_{0})-\operatorname{Var}(b_{1}))^{-1}(b_{1}-b_{0}),</math>
 
چنانچه آماره آزمون محاسبه شده بزرگتر از مقدار جدول باشد، فرضيهفرضیه H0 رد شده و [[همبستگی]] وجود داشته و در نتيجهنتیجه بايدباید از روش اثرات تصادفيتصادفی استفاده کرد.