شاخص لینکلن یک معیار اندازه‌گیری آماری در زمینه‌های مختلف است که به منظور برآورد تعداد موردهایی است که هنوز مشاهده نشده‌است که بر اساس دو مجموعه مستقل که هردو به صورت جداگانه مشاهده شده‌اند. توسط فردریک چارلز لینکلن در سال ۱۹۳۰ توضیح داده شده‌است که این شاخص را به به عنوان روش لینکلن-پترسون پس از C. G. یوهانس پترسن که اولین نفری بود که از روش مشابه علامت زدن و بازگرفتن استفاده کرد.[۱]

شاخص لینکلن
شاخص لینکلن استفاده شده در آزمایش گرفتن نمونه

برنامه‌های کاربردی

ویرایش

دو ناظر را در نظر بگیرید که به‌طور جداگانه به شمارش تعداد گونه مختلف از گیاهان یا حیوانات در یک منطقه می‌پردازند. اگر هر یک از آن‌ها برگردد و پس از پیدا کردن ۱۰۰ گونه که تنها ۵ گونه خاص یکسان توسط هر دو ناظر پیدا شده‌اند، بنابراین ۹۵ گونه حداقل توسط یک ناظر از بین رفته‌است. (که این عدد یعنی ۹۵ گونه دیگر توسط ناظر دیگر پیدا شده‌است). بنابراین هر دو ناظر مقداری زیادی گونه ناشناخته را از دست داده‌اند. از سوی دیگر، اگر ۹۹ از ۱۰۰ گونه هر ناظر مشابه ناظر دیگر باشد، این انتظار منصفانه است که درصد بالایی از گونه‌هایی که در آنجا زندگی می‌کنند را پیدا کردند.

همان استدلال برای روش علامت زدن و بازگرفتن انجام می‌شود. اگر برخی از حیوانات در یک منطقه مشخص شده علامت زده شوند و سپس آزاد شوند، و سپس بعداً دور دومی همین کار صورت بگیرد: تعداد حیوانات علامت زده شده در دور دوم می‌تواند برای تولید تخمینی از کل جمعیت استفاده شود.[۲]

مثال دیگری مطرح در زبانشناسی محاسباتی برای برآورد کل واژه‌های یک زبان است. با توجه به دو نمونه مستقل، از همپوشانی بین واژه‌های آن‌ها، این ویژگی مفید برآورد که چه بسیار واژه‌هایی وجود دارند اما در هیچ نمونه ای مشاهده نشده‌است. یک مثال مشابه شامل برآورد تعداد اشتباهات تایپی باقی مانده در یک متن از شمارش دو ویرایشگر متن می‌توان اشاره کرد.

فرمول بندی

ویرایش

شاخص لینکلن این پدیده را قابل حل می‌کند. اگر E1 و E2 عددی از تعداد گونه‌ها باشند (یا کلمات یا پدیده‌های دیگر) و توسط دو روش مستقل مشاهده شوند و S عدد تعداد مشاهدات مشترک باشد، سپس شاخص لینکلن به سادگی به صورت زیر تعریف می‌شود

 
فرمول طراحی شده شاخص لینکلن

برای مقادیر S < 10 این برآورد سخت است و برای مقادیر S < 5 بسیار سخت‌تر است. در مورد که در آن S = ۰ (که نشان دهندهٔ عدم تداخل داده‌های مشاهده شده‌است) شاخص لینکلن تعریف نشده‌است. این حالت در شرایطی می‌تواند به وجود بیاید که ناظران تنها درصد کمی تفاوت از این گونه (احتمالا به خاطر خوب دقت نکردن یا زمان کافی را نگذاشتن) بیابند، اگر ناظران هم از روش آماری استفاده کنند که به طول کامل مستقل نباشد (برای مثال یکی از مشاهده گران فقط دنبال موجودات بزرگ و دیگری دنبال موجودات کوچک باشد) یا در حالت‌های دیگر چنین اتفاقی می‌افتد.

محدودیت‌ها

ویرایش

شاخص لینکلن صرفاً یک تخمین است. برای مثال، گونه‌های داده شده در یک منطقه می‌توانند بسیار رایج یا بسیار نادر به هم باشند یا بسیار سخت یا بسیار آسان قابل دیدن باشند.[۳] بنابراین احتمال اینکه هر دو ناظر سهم زیادی از گونه‌های رایج پیدا کنند زیاد است که ممکن سهم زیادی از موجودات نادر را از دست بدهند. چنین توزیعی دیگر در این برآورد کارایی ندارد. البته، چنین توزیع‌هایی غیرمعمول برای پدیده‌های طبیعی هستند همان‌طور که طبق قانونZipf اشاره شده‌است).

همچنین T. J. Gaskell و B. J. جورج ادعا می‌کند که شاخص لینکلن سبب کاهش یکنواختی در داده‌ها می‌شود.[۴]

جستارهای وابسته

ویرایش

برای مطالعهٔ بیشتر

ویرایش
  • Lincoln, Frederick C. (May 1930). Calculating Waterfowl Abundance on the Basis of Banding Returns. Circular. Vol. 118. Washington, DC: United States Department of Agriculture. Retrieved 21 May 2013.
  • Petersen, C. G. J. (1896). "سالانه مهاجرت از جوان Plaice به Limfjord از، دریا", گزارش دانمارکی ایستگاه بیولوژیکی (۱۸۹۵), ۶, ۵–۸۴.
  • T. J. Gaskell; B. J. George (1972). "A Bayesian Modification of the Lincoln Index". Journal of Applied Ecology. 9 (2): 377–384. doi:10.2307/2402438.

یادداشت

ویرایش
  1. Southwood, T.R.E. & Henderson, P. (2000) Ecological Methods, 3rd edn. Blackwell Science, Oxford.
  2. "Estimating Population Sizes by Mark-recapture and Removal Sampling Methods". University of Texas. Archived from the original on 22 November 2018. Retrieved 8 November 2018.
  3. T. Bohlin; B. Sundstrom (1977). "Influence of unequal catchability on population estimates using the Lincoln and the removal method applied to electro-fishing". OIKOS: 123–129. JSTOR 3543331.
  4. Gaskell and George (1972)