پیکره متنی: تفاوت میان نسخه‌ها

محتوای حذف‌شده محتوای افزوده‌شده
جز تمیزکاری یادکردها (وظیفه ۱۹)
FreshmanBot (بحث | مشارکت‌ها)
جز ←‏روش‌های فراهم ساختن پیکره: اصلاح فاصله مجازی + اصلاح نویسه با ویرایشگر خودکار فارسی
خط ۲:
 
== روش‌های فراهم ساختن پیکره ==
در گذشته، فراهم ساختن پیکره‌های زبانی برای تألیف فرهنگ بسیار وقت‌گیر، پرزحمت و پرهزینه بود؛ مثلاً [[علی‌اکبر دهخدا]] و همکارانش برای تألیف ''[[لغت‌نامه دهخدا|لغت‌نامه]]'' سالیان درازی متون منظوم و منثور [[زبان فارسی]] را سطربه‌سطر خواندند و برگه‌های انبوهی حاوی واژه‌ها، شواهد و ارجاعات آنهاآن‌ها فراهم آوردند. مجموعهٔ داده‌های زبانی‌ای که دهخدا و یارانش به روش سنتیِ برگه‌نویسی فراهم آوردند، به‌لحاظ حجم، به‌ویژه درمورددر مورد متون کهن زبان فارسی، در آن زمان و حتی تا زمانهٔ ما، بی‌نظیر بوده و هست.
امروزه، پیشرفت‌های شگرف بشر در زمینهٔ فناوری اطلاعات، به‌ویژه رایانه، استفاده از این ابزار را برای گردآوری داده‌های زبانی و تألیف فرهنگ‌های مختلف براساس این داده‌ها ناگزیر می‌سازد؛ چنان‌که در کشورهای پیشرفته، روش سنتی گردآوری داده‌ها به‌کلی متروک شده و فرهنگ‌های گوناگونی، ازجمله ''کوبیلد'' ''(COBUILD)''، ''[[فرهنگ انگلیسی آکسفورد|فرهنگ بیست‌جلدی آکسفورد]]'' و جز آنهاآن‌ها براساس پیکره‌های زبانیِ رایانه‌ای تألیف یا تکمیل می‌گردند.<ref>بنگرید به: صادقی، علی‌اشرف. ''فرهنگ جامع زبان فارسی''، جلد «آ». ۱۳۹۲. راهنمای استفاده از فرهنگ، ص ۹.</ref>
 
== جستارهای وابسته ==