دادههای پانلی: تفاوت میان نسخهها
محتوای حذفشده محتوای افزودهشده
جز ربات: حذف میانویکی موجود در ویکیداده: ۱۲ میانویکی |
جز ویکیسازی رباتیک(۶.۸) >متغیر تصادفی، متغیر وابسته، اندازه گیری، عرض از مبدأ، تصمیم گیری، نوع داده+املا... |
||
خط ۱:
در [[آمار]] و [[اقتصاد سنجی]]، مجموعه دادههای پانلی شامل مشاهداتی برای چندین بخش(خانوار، بنگاه و...) می باشند که در طی زمانهای مختلف جمع آوری شده اند. یعنی یک [[مدل]] دادههای پانل حاوی اطلاعاتی در زمان و مکان است که شامل N مؤلفه در T دوره زمانی می باشد.{{سخ}}
اگر تعداد مشاهدات زمانی برای تمام مؤلفههای موجود در پانل یکسان باشد، به آن پانل متوازن(Balanced Panel) گفته می شود. اما در صورتی که مشاهدات مفقوده ای برای تعدادی از مؤلفهها وجود داشته باشد، پانل را نامتوازن می نامیم.
== مزایای دادههای پانل ==
1- محققین می توانند از دادههای پانلی برای مواردی که مسائل را نمی توان
2- دادههای پانلی حاوی اطلاعات بیشتر، تنوع گسترده تر و [[هم خطی]] کمتر میان متغیرها بوده و در نتیجه کاراتر می باشند. در حالیکه در سریهای زمانی هم خطی بیشتری را بین متغیرها مشاهده می کنیم. با توجه به اینکه دادههای پانلی ترکیبی از سریهای زمانی و مقطعی می باشد، بعد مقطعی موجب اضافه شدن تنوع زیادی شده و در نتیجه برآوردهای معتبرتری را می توان انجام داد. در اینجا تعداد مشاهدات ما به NT افزایش یافته که منجر به برآوردهای کاراتری از متغیرها می شود.این امر را می توان در محاسبه [[واریانس]] جامعه مشاهده کرد. در دادههای سری زمانی این واریانس به صورت σ^2=σ2/N-K محاسبه میشود ولی در دادههای پانلی به صورت σ^2=σ2/NT-N-K قابل محاسبه است. چون مخرج کسر دومی بزرگتر از کسر اولی است، پس واریانس دادههای پانلی کمتر بوده و بنابراین تخمین کاراتری خواهد داشت.{{سخ}}
خط ۱۰:
3- دادههای پانلی امکان طراحی الگوهای رفتاری پیچیده تری را فراهم می کنند.{{سخ}}
4- دادههای پانلی امکان بیشتری را برای شناسایی و [[اندازه گیری]] اثراتی فراهم می کنند که با اتکای صرف به آمارهای مقطعی یا سری زمانی به سادگی قابل شناسایی نیستند.
== روشهای تخمین مدل ==
خط ۱۷:
<math>Y_{it} = \alpha_{i} + \beta' X_{it} + u_{it}.</math>
که در آن β یک بردار k*1 از پارامترها، <math>X_{it}</math> یک بردار k*1 از مشاهدات مربوط به متغیرهای توضیحی، t=1,
قبل از هر جیز باید [[نوع داده]] ها از جهت پانل و یا پولین بودن مشخص گردد که برای این منظور از آزمون لیمر استفاده خواهد شد که دارای آماره F می باشد. در این جا دو حالت وجود دارد یا داده های ما از نوع پولینگ می باشند که باید با استفاده از روش اثرات مشترک تخمین زده شوند، و یا داده ها از نوع پانل هستند کا باید با استفاده از یکی از دو روش اثرات پابت و یا اثرات متغیر که در ادامه ارائه شده ان تخمین زده شوند (عزت الله لطفی، 1391).
نخست مدل اثرات ثابت که در آن <math>\alpha_{i}</math> ها N پارامتر نامعلوم ولی ثابت هستند و دیگری مدل اثرات تصادفی که در آن عرض از مبدا ثابت نبوده و تصادفی است و همچنین مستقل از متغیرهای توضیحی می باشد.
خط ۲۸:
مدل اخیر یک مدل رگرسیونی کلاسیک بوده و هیچ شرط جدیدی برای تجزیه و تحلیل آن لازم نیست و می توان مدل را با استفاده از OLS برآورد کرد.{{سخ}}
مزیت مدل با اثرات ثابت این است که می تواند اثراتی را که در هر یک از مؤلفهها متفاوت است ولی در طول زمان تغییر
برای برطرف کردن این مشکل یک راه آن است که میانگین زمانی هر یک از متغیرها را از مقدار اصلی آنها کم کنیم. با این کار به مدلی می رسیم که فاقد [[عرض از مبدأ]] خواهد بود و می توانیم روش حداقل مربعات معمولی رابرای آن اجرا کنیم که مراحل تکنیکی آن در زیر آورده شده است:{{سخ}}
<math>y_{it}-\overline{y_{i}}=\left(X_{it}-\overline{X_{i}}\right) \beta+\left( u_{it}-\overline{u_{i}}\right)</math>
where <math>\overline{X_{i}}=\frac{1}{T}\sum\limits_{t=1}^{T}X_{it}</math> and <math>\overline{u_{i}}=\frac{1}{T}\sum\limits_{t=1}^{T}u_{it}</math>.{{سخ}}
خط ۵۰:
=== مدل اثرات تصادفی ===
یک روش جایگزین برای تخمین مدل اثرات ثابت، تخمین مدل اثرات تصادفی است. تفاوت چنین مدلی با اثرات ثابت این است که در آن عرض از مبدأ مختص هر یک از متغیرها مقادیر ثابتی نیستند، بلکه به صورت تصادفی انتخاب می شوند. لذا مقدار <math>\alpha_{i}</math> در مدل کلی برابر است با <math>\alpha_{it} = \mu_i + \nu_{it}.</math>
فرم کلی چنین مدلی به صورت روبرو می باشد:
<math>Y_{it} =\mu + \beta' X_{it} + v_{i} + u_{it}.</math>
خط ۶۱:
که در آن <math>\Sigma</math> واریانس <math>u_{it}</math> و <math>\Iota</math> ماتریس واحد و <math>\Omega</math> ماتریس واریانس-کوواریانس می باشد.{{سخ}}
با معرفی این دو روش سؤالی که پیش می آید این است که در عمل ما بایستی کدامیک از روشهای مذکور را استفاده کنیم. برای [[تصمیم گیری]] از آزمون هاسمن کمک می گیریم.
== آزمون هاسمن ==
برای آنکه بتوانیم بین مدلهای اثرات ثابت و اثرات تصادفی از نظر قدرت توضیح دهندگی [[متغیر وابسته]] مقایسه ای انجام دهیم، از آزمونی به نام '''آزمون هاسمن''' استفاده می کنیم. از آنجا که برای انجام مقایسه بین این دو مدل باید وجود همبستگی بین اثرات تصادفی(<math>\alpha_{i}</math> ) و رگرسورها را مورد آزمون قرار دهیم، لذا در آزمون هاسمن فرضیه صفر این است که هیچ همبستگی میان اثرات تصادفی و رگرسورها وجود ندارد. تحت این فرضیه، تخمین زن هایOLS وGLS هر دو سازگار هستند ولی تخمین زن OLS ناکاراست. در شرایطی که تحت فرضیه مقابل، تخمین زن OLS کارا و سازگار ولی تخمین زن GLS ناسازگار است.{{سخ}}
[[آماره]] این آزمون به صورت زیر است:{{سخ}}
خط ۸۹:
[[رده:دادههای پانلی]]
[[رده:آمار چندمتغییره]]▼
[[رده:اقتصاد]]
[[رده:اقتصادسنجی]]
▲[[رده:آمار چندمتغییره]]
[[رده:انواع دادههای آماری]]
[[رده:ویکیسازی رباتیک]]
|