پیکره انگلیسی آمریکایی معاصر

پیکرهٔ انگلیسی آمریکایی معاصر (کوکا) COCA (به انگلیسی: Corpus of Contemporary American English) وب‌گاهی است رایگان با قابلیت جستجوی کلمه، که در نوع خود بزرگترین است، شامل حدود ۴۵۰ میلیون واژهٔ انگلیسی (انگلیسی آمریکایی معاصر). این مجموعه تنها پیکرهٔ در دسترس عمومی است. این مجموعه زیرنظر مارک دِیویس، استاد زبان‌شناسی پیکره‌ای در دانشگاه بریگم یانگ طراحی و ساخته شده‌است.

«کوکا» از بیش از ۴۵۰ میلیون واژه، درمجموع شامل ۱۶۰٬۰۰۰ متن تشکیل شده‌است. بازهٔ زمانیِ متن‌های پیکره، دربرگیرندهٔ سال‌های ۱۹۹۰ تا ۲۰۱۵ است. از متن‌های هر سال ۲۰ میلیون واژه انتخاب شده‌است. متن‌های هر سال، پنج ژانر (مقولهٔ اصلیِ موضوعی) را دربرمی‌گیرد: زبان گفتاری، ادبیات داستانی، مجلههای عمومی، روزنامهها، و نشریات دانشگاهی/ آکادمیک.

آخرین نسخهٔ این پیکره در دسامبر ۲۰۱۵ عرضه شد. ماهانه ده‌ها هزار نفر از وبگاه «کوکا» بازدید می‌کنند. ظاهراً این وبگاه پربازدیدترین منبعِ رایگانِ برخط با این موضوع است.

منابع مورداستفادهویرایش

برای تهیهٔ این پیکره از منابع گوناگونِ زیر استفاده شده‌است:

  • گفتاری (۸۵ میلیون واژه): صورتِ نوشتاریِ مکالمه‌های نانوشته، برگرفته از ۱۵۰ برنامهٔ تلویزیونی و رادیوییِ گوناگون؛
  • ادبیات داستانی (۸۱ میلیون واژه): داستان کوتاه و نمایش‌نامه، فصل نخست کتاب‌های گوناگون در این موضوع (منتشرشده از سال ۱۹۹۰ و پس از آن)، متنِ فیلم‌ها/ فیلم‌نامهها؛
  • مجلات عمومی (۸۶ میلیون واژه): حدود ۱۰۰ مجلهٔ گوناگون با موضوعاتِ مختلف، ازجمله خبری، تندرستی، خانوادگی، باغبانی، بانوان، مالی، مذهبی، و ورزشی؛
  • روزنامه‌ها (۸۱ میلیون واژه): ۱۰ روزنامه از سراسرِ ایالات متحده. متن‌های بخش‌های گوناگونِ روزنامه‌ها، شامل اخبار محلی، دیدگاه‌ها، ورزش، و بخش تجاری انتخاب شده‌اند؛
  • نشریات دانشگاهی/ آکادمیک (۸۱ میلیون): حدود ۱۰۰ نشریهٔ علمی-پژوهشی از همهٔ موضوعات رده‌بندی‌شده در کتابخانهٔ ملی کنگرهٔ آمریکا انتخاب شده‌است.

پیوند به بیرونویرایش

منابعویرایش