زبان‌شناسی پیکره‌ای

زبان‌شناسی پیکره‌ای (به انگلیسی: corpus linguistics) شاخه‌ای از زبان‌شناسی است که در آن از طریق ایجاد پایگاه‌های داده‌ایِ گسترده‌ای از متون و واژگان رایجِ یک زبان و بررسی این متون به مطالعهٔ جنبه‌های گوناگون آن زبان می‌پردازد.[۱]

این شاخه تنها در آخرین دهه‌های قرن بیستم ایجاد شد و در همین زمان کوتاه تبدیل به یکی از فعال‌ترین و پرکاربردترین زمینه‌ها شده‌است.[۲]

پیکرهٔ زبانی عبارت است از مجموعه‌ای از متن‌های نوشتاری یا گفتاری که می‌توان در توصیف و تحلیل زبان از آن بهره گرفت. پیکره ممکن است به‌شکل برگه‌های یادداشت یا پرونده‌های رایانه‌ای شامل متن‌های کامل یا گزیده‌هایی از آنها، یا بخش‌های پیوسته‌ای از متون یا گزیده‌ای از نقل‌قول‌ها و نکات و حتی فهرست‌های واژگانی باشد.[۲]

برای گویاتر شدن پیکره و کاربردهای خاص، کدهای متفاوتی به آن افزوده می‌شود. این نشانه‌گذاری از یک‌سو می‌تواند برای ارتباط دادن بخش‌های یک پیکره به ساختار کلی آن باشد، مانند شمارهٔ سطر، صفحه، فصل و مانند اینها، یا بافت زبانی را مشخص کند، مانند شرایط تولید زبانی، گونهٔ زبانی، رسانه و مانند آن. از سوی دیگر، نشانه‌گذاری می‌تواند صرفاً زبانی باشد.[۳]

برنامه‌های پایشگری زبان برای پی‌گیری و ردگیری تحولات زبانی نیز از امکانات پیکره‌های زبانی سود می‌برند. این‌گونه پیکره‌ها را «پیکرهٔ پویا» یا «پیکرهٔ پایشگر» می‌نامند.[۴]

جستارهای وابسته

ویرایش

منابع

ویرایش

  1. مجموعهٔ واژه‌های مصوّب فرهنگستان زبان و ادب فارسی تا پایان سال ۱۳۸۹.
  2. ۲٫۰ ۲٫۱ عاصی، مصطفی: از پیکرهٔ زبانی تا زبان‌شناسی پیکره‌ای، در نشریهٔ «پژوهشگران»، مرداد و شهریور ـ مهر و آبان ۱۳۸۵، شمارهٔ ۸ و ۹.
  3. عاصی، مصطفی: زبان‌شناسیِ پیکره‌ای؛ پردازش دستوریِ زبان فارسی با رایانه، ۱۶ فوریهٔ ۲۰۱۱.
  4. عاصی، مصطفی: زبان‌شناسیِ پیکره‌ای؛ پردازش دستوری زبان فارسی با رایانه، ۱۶ فوریهٔ ۲۰۱۱.