زبان‌شناسی رایانشی

زبان‌شناسی رایانشی (Computational linguistics) حوزه‌ای میان‌رشته‌ای است که می‌کوشد با بهره‌گیری از روش‌های آماری و قاعده‌بنیاد (rule-based)، به مدل‌سازی زبان طبیعی بپردازد. به شکل سنتی زبان‌شناسی رایانشی در قلمرو کاری دانشمندان کامپیوتری قرار داشت که در حوزه‌ی پردازش یک زبان خاص توسط کامپیوتر تخصص لازم را کسب کرده بودند. امروزه زبان‌شناسان رایانشی به عنوان اعضای گروه‌های میان‌رشته‌ای به فعالیت می‌پردازند، که اعضای این تیم‌ها می‌توانند شامل زبان‌شناسان (به شکل خاص در زمینه‌ی زبان‌شناسی همگانی تخصص دارند)، کارشناسان زبان (افرادی با پیش‌زمینه و تا حدی دارای مهارت‌های عملی مرتبط با پروژه‌ی مورد نظر)، و دانشمندان علم کامپیوتر باشند. به‌طور کلی، زبان‌شناسی رایانشی از همکاری دانشمندان و کارشناسان رشته‌های زبان‌شناسی، علوم رایانه‌ای، متخصصین زمینه‌ی هوش مصنوعی، ریاضی، منطق، علوم شناختی، روان‌شناسی شناختی، روان-زبان‌شناسی، مردم‌شناسی، عصب‌شناسی و برخی دیگر از رشته‌ها استفاده می‌کند.

زبان‌شناسی رایانشی دارای زیر شاخه‌های نظری و کاربردی است. زبان‌شناسی رایانشی نظری به بررسی و مطالعه زبان‌شناسی نظری با در نظر داشتن علوم شناختی می‌پردازد و زبانشناسی رایانشیِ کاربردی نتایج کاربردی مدل‌سازی برای زبان را مد نظر قرار می‌دهد.^[۱]

خاستگاه ویرایش

پیدایش حوزه زبان‌شناسی رایانشی به عنوان یک حوزه علمی و مطالعاتی، به قبل از پیدایش هوش مصنوعی (حوزه‌ای که زبان‌شناسی رایانشی اغلب زیر شاخه‌ای از آن محسوب می‌شود) بازمی‌گردد. زمینۀ شکل‌گیریِ زبان‌شناسی رایانشی را باید در تلاش‌های ایالات متحده در دهه ۱۹۵۰ جستجو کرد، یعنی زمانی که آن‌ها در تلاش بودند تا بتوانند با استفاده از رایانه به شکل خودکار متون زبان‌های بیگانه، به خصوص منابع علمی به زبان روسی، را به انگلیسی ترجمه کنند.^[۲] از آنجا که سیستم‌های رایانه‌ای، پردازش‌های ریاضیاتی را بسیار سریع تر از انسان‌ها انجام می‌دهند در ابتدا چنین تصور شد که مسایل تکنیکی ترجمه ماشینی به سرعت حل خواهند شد و آن‌ها قادر خواهند بود تا ماشین‌های ترجمه با توانایی‌های مشابه انسان بسازند.^[۳]

ترجمه ماشینیِ (نام دیگر: ترجمه مکانیکی) ابتدایی، که بر اساس دانش و فناوریِ آن دوران طراحی شده بود، چندان در ترجمۀ «درست» متن‌های گفناری ونوشتاری کامیاب نبود؛ از پسِ مشاهده و تحلیلِ مصداق‌های پرشمار ترجمه‌های ماشینیِ غلط یا نارسا بود که پژوهشگران این حوزه دریافتند که پردازش زبانی از آنچه پیشتر تصور می‌کردند، پیچیده‌تر است. به‌این‌ترتیب، «زبان‌شناسی رایانشی» به عنوان شاخه‌ای جدید از علوم متولد شد؛ حوزه‌ای در علم و فناوری که به تولید الگوریتم‌ها و نرم‌افزارهای بررسی هوشمند داده‌های زبانی می‌پردازد. از دهۀ 1960 میلادی، که زبان‌شناسی رایانشی پا به عرصه گذاشت، به عنوان زیر شاخه‌ای از هوش مصنوعی در نظر گرفته شد؛ شاخه‌ای که مشخصاً به بررسی، فهم و تولید زبان در سطح هوشی انسانی می‌پردازد.

پس از بررسی نحوه انجام ترجمه صحیح توسط انسان‌ها چنین مشاهده شد که فرد مترجم می‌بایست به دستور، تکواژشناسی و همچنین قواعد نحوی هر دو زبان آگاهی داشته باشد. مبانی آگاهی از نحو نیز، داشتن دانش معناشناسی، واژگان و همچنین کاربردشناسی شناسایی شدند؛ بنابراین تلاش در جهت تحقق ترجمهٔ ماشینی به شاخه‌ای پیچیده از علوم برای توصیف، نمایش و پردازش ماشینی زبان‌های انسانی تبدیل شد.^[۴]

موارد کاربرد ویرایش

در مورد استفاده از آن از جمله می‌توان به کاربردهای زیر اشاره کرد:

فرایافت concept و تجزیه زبانهای برنامه‌نویسی ویرایش

نوآم چامسکی توانست تشابه زبانهای طبیعی و زبان های برنامه‌نویسی را به اثبات برساند. یعنی یک زبان رایانه‌ای مانند زبانهای طبیعی دارای یک دستور زبان و یک فرهنگ می‌باشد. تفسیر یک متن از تجزیهٔ واژه‌ها lexicon آغاز سپس با تجزیه نحو syntax و در آخر با تجزیه مفهوم semantic آن پایان میابد.

ترجمه ماشینی ویرایش

مقالهٔ اصلی: ترجمه ماشینی (خودکار)

این شاخه از زبان‌شناسی رایانه‌ای زمان درازی کم‌اهمیت جلوه می‌کرد. اما امروزه یکی از موارد مورد علاقه پژوهشگران این رشته است. پس از مرحلهٔ شکافت واژه‌ها و نحو می‌باید تجزیهٔ مفهوم و سپس پراگماتیک را نیز افزود. در واقع این دو کوشش بر شناخت مفهوم خاص یک واژه در مکانی که ظاهر می‌شود را دارد.

پرسش و پاسخ با زبانهای طبیعی ویرایش

این ایده مدتی به‌عنوان پاسخی قانع‌کننده به مسئله ارتباط انسان و ماشین تلقی می‌شد. این دید در واقع جنبهٔ گسترده‌تری از دستور زایشی چامسکی است.

صرف محاسباتی ویرایش

مقالهٔ اصلی: صرف محاسباتی

به مطالعات مربوط به ساختارهای^[۵] درونی واژه ها صرف گفته می‌شود. اغلب دست‌آوردها و نتایج پژوهشهای صرف محاسباتی در سایه تلاشهای علمی انسان به منظور ایجاد و ساخت سامانه های پردازش زبان‌های طبیعی انسانی فراهم آمده‌است.

پانویس ویرایش

↑ Hans Uszkoreit. What Is Computational Linguistics? [۱] Department of Computational Linguistics and Phonetics of Saarland University
↑ John Hutchins: Retrospect and prospect in computer-based translation. بایگانی‌شده در ۱۴ آوریل ۲۰۰۸ توسط Wayback Machine Proceedings of MT Summit VII, 1999, pp. 30–44.
↑ Arnold B. Barach: Translating Machine 1975: And the Changes To Come.
↑ Natural Language Processing by Liz Liddy, Eduard Hovy, Jimmy Lin, John Prager, Dragomir Radev, Lucy Vanderwende, Ralph Weischedel
↑ Structures

منابع ویرایش

Crystal D. , The Cambridge Encyclopedia of Language, 2nd edition, Cambridge University Press, 1996. ISBN 0-521-55967-7
Manning, C. D. , and Schutze, H. , Foundations of Statistical Natural Language Processing, 5th edition, The MIT Press, 2002. ISBN 0-262-13360-1
Linguistique informatique, Wikipedia
O'Grady, W. , Dobrovolsky, M. , and aronoff, M. , Contemporary Linguistics, An Introduction, 2nd edition, St. Martin' Press, Inc. , 1993. ISBN 0-312-06780-1

پیوند به بیرون ویرایش

منظور از زبان‌شناسی محاسباتی چیست؟ (انگلیسی)
انجمن زبان‌شناسی محاسباتی (انگلیسی)
مرکز مطالعات زبان‌ها و اطلاعات، مؤسسه تحقیقات عالی پیرامون برخوردهای انسان‌ها با علوم و فناوری، دانشگاه استانفورد (انگلیسی)
مرجع دادگان زبان فارسی پیکره‌های فارسی مورد استفاده در پردازش رایانه‌ای زبان و مطالعات زبان‌شناختی

[1] Hans Uszkoreit. What Is Computational Linguistics? [۱] Department of Computational Linguistics and Phonetics of Saarland University

[2] John Hutchins: Retrospect and prospect in computer-based translation. بایگانی‌شده در ۱۴ آوریل ۲۰۰۸ توسط Wayback Machine Proceedings of MT Summit VII, 1999, pp. 30–44.

[3] Arnold B. Barach: Translating Machine 1975: And the Changes To Come.

[4] Natural Language Processing by Liz Liddy, Eduard Hovy, Jimmy Lin, John Prager, Dragomir Radev, Lucy Vanderwende, Ralph Weischedel

[5] Structures

[۱]

[۲]

[۳]

[۴]

[۵]