پیکره انگلیسی آمریکایی معاصر

پیکرهٔ انگلیسی آمریکایی معاصر (کوکا) COCA (به انگلیسی: Corpus of Contemporary American English) وبگاهی است با قابلیت جستجوی کلمه، که در نوع خود بزرگ‌ترین است، شامل یک میلیارد واژهٔ انگلیسی (انگلیسی آمریکایی معاصر). این مجموعه تنها پیکرهٔ در دسترس عمومی است. این مجموعه زیر نظر مارک دِیویس، استاد بازنشستهٔ زبان‌شناسی پیکره‌ای در دانشگاه بریگم یانگ (BYU) طراحی و ساخته شده است.

«کوکا» از بیش از یک میلیارد واژه، درمجموع شامل ۴۸۵٬۲۰۲ متن تشکیل شده است. بازهٔ زمانیِ متن‌های پیکره، دربرگیرندهٔ سال‌های ۱۹۹۰ تا ۲۰۱۹ است. از متن‌های هر سال ۲۴ تا ۲۵ میلیون واژه انتخاب شده است. متن‌های هر سال، پنج ژانر (مقولهٔ اصلیِ موضوعی) را دربرمی‌گیرد: زبان گفتاری، ادبیات داستانی، مجله‌های عمومی، روزنامه‌ها، و نشریات دانشگاهی/ آکادمیک.

آخرین نسخهٔ این پیکره در نوامبر ۲۰۲۱ عرضه شد. ماهانه ده‌ها هزار نفر از وبگاه «کوکا» بازدید می‌کنند. ظاهراً این وبگاه پربازدیدترین منبعِ برخط با این موضوع است.

منابع مورداستفاده

ویرایش

برای تهیهٔ این پیکره از منابع گوناگونِ زیر استفاده شده است:

  • زیرنویس برنامه‌های تلویزیونی/فیلم‌ها (۱۲۸ میلیون واژه): صورتِ نوشتاریِ متن‌های برگرفته از نمایش‌های تلویزیونی و فیلم‌های آمریکایی؛
  • گفتاری (۱۲۷ میلیون واژه): صورتِ نوشتاریِ مکالمه‌های نانوشته، برگرفته از ۱۵۰ برنامهٔ تلویزیونی و رادیوییِ گوناگون؛
  • ادبیات داستانی (۱۲۰ میلیون واژه): داستان کوتاه و نمایشنامه، فصل نخست کتاب‌های گوناگون در این موضوع (منتشرشده از سال ۱۹۹۰ و پس از آن)، متنِ فیلم‌ها/ فیلم‌نامه‌ها؛
  • مجلات عمومی (۱۲۷ میلیون واژه): حدود ۱۰۰ مجلهٔ گوناگون با موضوعاتِ مختلف، ازجمله خبری، تندرستی، خانوادگی، باغبانی، بانوان، مالی، مذهبی، و ورزشی؛
  • روزنامه‌ها (۱۲۳ میلیون واژه): ۱۰ روزنامه از سراسرِ ایالات متحده. متن‌های بخش‌های گوناگونِ روزنامه‌ها، شامل اخبار محلی، دیدگاه‌ها، ورزش، و بخش تجاری انتخاب شده‌اند؛
  • نشریات دانشگاهی/ آکادمیک (۱۲۱ میلیون): حدود ۱۰۰ نشریهٔ علمی-پژوهشی از همهٔ موضوعات رده‌بندی‌شده در کتابخانهٔ ملی کنگرهٔ آمریکا انتخاب شده است.

پیوند به بیرون

ویرایش

منابع

ویرایش