پیکره انگلیسی آمریکایی معاصر
پیکرهٔ انگلیسی آمریکایی معاصر (کوکا) COCA (به انگلیسی: Corpus of Contemporary American English) وبگاهی است با قابلیت جستجوی کلمه، که در نوع خود بزرگترین است، شامل یک میلیارد واژهٔ انگلیسی (انگلیسی آمریکایی معاصر). این مجموعه تنها پیکرهٔ در دسترس عمومی است. این مجموعه زیر نظر مارک دِیویس، استاد بازنشستهٔ زبانشناسی پیکرهای در دانشگاه بریگم یانگ (BYU) طراحی و ساخته شده است.
«کوکا» از بیش از یک میلیارد واژه، درمجموع شامل ۴۸۵٬۲۰۲ متن تشکیل شده است. بازهٔ زمانیِ متنهای پیکره، دربرگیرندهٔ سالهای ۱۹۹۰ تا ۲۰۱۹ است. از متنهای هر سال ۲۴ تا ۲۵ میلیون واژه انتخاب شده است. متنهای هر سال، پنج ژانر (مقولهٔ اصلیِ موضوعی) را دربرمیگیرد: زبان گفتاری، ادبیات داستانی، مجلههای عمومی، روزنامهها، و نشریات دانشگاهی/ آکادمیک.
آخرین نسخهٔ این پیکره در نوامبر ۲۰۲۱ عرضه شد. ماهانه دهها هزار نفر از وبگاه «کوکا» بازدید میکنند. ظاهراً این وبگاه پربازدیدترین منبعِ برخط با این موضوع است.
منابع مورداستفاده
ویرایشبرای تهیهٔ این پیکره از منابع گوناگونِ زیر استفاده شده است:
- زیرنویس برنامههای تلویزیونی/فیلمها (۱۲۸ میلیون واژه): صورتِ نوشتاریِ متنهای برگرفته از نمایشهای تلویزیونی و فیلمهای آمریکایی؛
- گفتاری (۱۲۷ میلیون واژه): صورتِ نوشتاریِ مکالمههای نانوشته، برگرفته از ۱۵۰ برنامهٔ تلویزیونی و رادیوییِ گوناگون؛
- ادبیات داستانی (۱۲۰ میلیون واژه): داستان کوتاه و نمایشنامه، فصل نخست کتابهای گوناگون در این موضوع (منتشرشده از سال ۱۹۹۰ و پس از آن)، متنِ فیلمها/ فیلمنامهها؛
- مجلات عمومی (۱۲۷ میلیون واژه): حدود ۱۰۰ مجلهٔ گوناگون با موضوعاتِ مختلف، ازجمله خبری، تندرستی، خانوادگی، باغبانی، بانوان، مالی، مذهبی، و ورزشی؛
- روزنامهها (۱۲۳ میلیون واژه): ۱۰ روزنامه از سراسرِ ایالات متحده. متنهای بخشهای گوناگونِ روزنامهها، شامل اخبار محلی، دیدگاهها، ورزش، و بخش تجاری انتخاب شدهاند؛
- نشریات دانشگاهی/ آکادمیک (۱۲۱ میلیون): حدود ۱۰۰ نشریهٔ علمی-پژوهشی از همهٔ موضوعات ردهبندیشده در کتابخانهٔ ملی کنگرهٔ آمریکا انتخاب شده است.
پیوند به بیرون
ویرایشمنابع
ویرایش- کتابخانهٔ دانشگاه آریزونا (معرفی «کوکا») بایگانیشده در ۲۴ آوریل ۲۰۱۴ توسط Wayback Machine
- وبگاه هلسینکی (معرفی «کوکا»)