ترجمه ماشینی: تفاوت میان نسخه‌ها

محتوای حذف‌شده محتوای افزوده‌شده
Rezabot (بحث | مشارکت‌ها)
خط ۲:
در سطح مقدماتی، ترجمه ماشینی یک جایگزینی ساده برای کلمات از زبان طبیعی به زبان دیگری است. با استفاده از تکنیک‌های [[زبان‌شناسی پیکره‌ای]]، ترجمه‌های پیچیده بیشتری قابل دستیابی هستند. همچنین این تکنیک‌ها کنترل بهتر تفاوت‌های گونه‌شناسی در زبان، تشخیص عبارات و ترجمهٔ اصطلاحات را به خوبی و درستی جدا کردن عبارات نامتعارف در متن، مقدور می‌سازند.
 
[[نرم‌افزار|نرم‌افزارهای]]های ترجمه ماشینی کنونی اغلب به کاربر اجازهٔ تغییر دلخواه بر اساس حوزه کاری یا حرفه‌ای دلخواه را می‌دهند (همانند [[هواشناسی|گزارش آب و هوا]]). در واقع ارتقاء کیفیت خروجی با استفاده از محدود کردن کلمات جایگزین شونده، انجام می‌شود.
این تکنیک بطور خاص در حوزهٔ رسمی یا زبانهای فرموله شده استفاده می‌شود. این بدین معنی است که ترجمه ماشینی از اسناد قانونی و دولتی آسان‌تر از تولید خروجی قابل استفاده از مکالمات یا متون غیر چهارچوب بندی شده دیگر است.
همچنین کیفیت خروجی بهبود یافته می‌تواند با استفاده از دخالت انسان بدست آید. برای مثال سیستم‌هایی موجودند که اگر کاربر بطور کاملاً واضحی کلماتی که اسامی خاص هستند را معین کرده باشد، قادر به ترجمه دقیق‌تری هستند. با کمک گرفتن از این تکنیک‌ها ترجمه ماشینی بعنوان یک ابزار برای کمک کردن به مترجمان (انسان‌ها) و بسیاری از موضوع‌های محدود، قادر به تولید خروجی قابل استفاده و نهایی است.
خط ۱۸:
# [[کدگذاری]] دوباره این معنا در زبان مقصد
 
در پس این فرایند بظاهر آسان، عملیات [[شناخت|شناختی]]ی پیچیده‌ای واقع است. به منظور رمز گشایی معنای متن مبدأ، مترجم باید قابلیت تفسیر و تجزیه تحلیل تمام ویژگی‌های متن را داشته باشد. یک فرایند که احتیاج به دانش عمیقی از [[دستور زبان]]، [[جمله‌شناسی]] (نحو)، [[معناشناسی]] و اصطلاحات از هر دو زبان مبدأ و مقصد دارد به همان اندازه باید دانش مربوط به [[فرهنگ]] صحبت کنندگان آن زبان را نیز داشته باشد.
از آن جهت، چالشی در ترجمه ماشینی وجود دارد که چگونه یک کامپیوتر را آموزش دهيمدهیم که بتواند همانند یک انسان متنی را بفهمد و بتواند یک متن جدید در زبان مقصد بسازد که بنظر می‌رسد توسط انسان نوشته شده‌است.
این مسئله ممکن است به روشهای مختلفی انجام شود.
 
خط ۳۰:
با توجه به طبیعت نمایش واسطه، یک روش به عنوان ترجمه ماشینی بین زبانی<ref>interlingual machine translation</ref> یا ترجمه ماشینی مبتنی بر انتقال<ref>transfer-based machine translation</ref> معرفی می‌شود. این روش‌ها نیاز به [[واژگان]] وسیعی با اطلاعات [[تک‌واژشناسی]]، [[دستور زبان]] و [[معناشناسی]] دارند.
 
با دادن داده‌های کافی [[نرم‌افزار|نرم‌افزارهای]]های ترجمه ماشینی حتی برای [[زبان اول|صحبت کننده بومی]] یک زبان به حدی خوب کار می‌کنند که معنی تقریبی آنچه توسط یک صحبت کننده بومی دیگر نوشته شده‌است بفهمد.
دشواری کار ترجمه خودکار، بدست آوردن اطلاعات کافی از نوع صحیح آن برای پشتیبانی روشی خاص است. به عنوان مثال یک پیکره وسیع چند زبانی از داده‌ها، برای روشهای آماری مورد نیاز است، حال آنکه برای روشهای مبتنی بر دستورزبان لازم نیست. اما از سویی دیگر روشهای مبتنی بر دستورزبان نیاز به یک زبان‌شناس حرفه‌ای برای طراحی دقیق دستورزبانی که استفاده خواهد شد، دارند.
برای ترجمه بین زبان‌های نزدیک بهم، تکنیکی به نام [[ترجمه ماشینی مبتنی بر انتقال]] سطحی<ref>shallow-transfer machine translation</ref> ممکن است استفاده شود.
خط ۵۸:
قوانین برای پیش-پردازش داده‌ها برای هدایت بهتر موتور آماری استفاده می‌شوند. قوانین همچنین برای پس-پردازش خروجی موتور آماری برای پیاده‌سازی عملیاتی همچون نرمال سازی استفاده می‌شوند. این روش قدرت، کنترل و [[انعطاف‌پذیری]] بسیار بیشتری دارد.
 
=== رمزگشایی ===
در سال های اخیر [[دانشگاه کالیفرنیای جنوبی]] (USC) بر روی روشهایی تمرکز کرده اند که ایده های اولیه آن از [[رمزنگاری]] استخراج شده اند. این روش هنوز در سطح تحقیقات اولیه است و تا رسیدن به یک روش قابل قبول فاصله زیادی باقی است. اما در صورت تحقق این روش ادعای [[وارن ویور]] که ترجمه ماشینی را تنها روشی برای رمزگشایی از متن رمزشده زبان مبدا در زبان مقصد می دانست، تحقق خواهد یافت.
مدل ترجمه در این روش بدون داده موازی از روی [[پیکره های نظیر]] آموزش داده می شوند و لذا در صورت تحقق تحولی شگرفت در فرآیندفرایند ترجمه بخصوص برای زبانهایی که دارای منابع زبانشناسی محدود هستند، خواهد بود.
 
== مسئله‌های اصلی ==
خط ۹۰:
 
با اینکه هیچ‌یک از سیستمها، خلاصه‌ای بدون خطا، تمام خودکار و با کیفیت بالا نمی‌توانند تولید کنند، بسیاری از سیستم‌های تمام خودکار، خروجی منطقی ای را تولید می‌کنند.<ref>[http://www.benjamins.com/cgi-bin/t_bookview.cgi?bookid=BTL%2014 Melby, Alan. The Possibility of Language (Amsterdam:Benjamins, 1995, 27-41)]</ref><ref>[http://tandibusiness.blogspot.com/2006/02/simple-model-outlining-translation.html Wooten, Adam. "A Simple Model Outlining Translation Technology" T&I Business (February 14, 2006)]</ref><ref>[http://www.mt-archive.info/Bar-Hillel-1960-App3.pdf Appendix III of 'The present status of automatic translation of languages', Advances in Computers, vol.1 (1960), p.158-163. Reprinted in Y.Bar-Hillel: Language and information (Reading, Mass. : Addison-Wesley, 1964), p.174-179.]</ref> کیفیت ترجمه ماشینی اگر حوزهٔ موضوعی متن محدود و کنترل شده باشد، اساساً بهتر خواهد شد.
با وجود محدودیت‌های موروثی، نرم‌افزارهای ترجمه ماشینی در سرتاسر جهان مورد استفاده می‌باشند. احتمالاً بزرگترین مؤسسه استفاده کننده از این نرم‌افزارها [[کمیسیون اروپا|کمیسیون اروپاست]]ست. پروژه مولتو(MOLTO)، که بوسیله [[دانشگاه گوتنبورگ]] ایجاد شده‌است، بیش از ۲٫۳۷ میلیون یورو بعنوان بودجهٔ حمایتی از [[اتحادیه اروپا]] برای ساخت ابزار مترجم قابل اطمینان دریافت کرده که بتواند بیشتر زبانهای اتحادیه اروپا را دربر بگیرد.
تاگل تکست(Toggletext)، یک سیستم مبتنی بر انتقال است که زبان [[زبان انگلیسی|انگلیسی]] را به [[زبان اندونزیایی|اندونزیایی]] ترجمه می‌کند.
 
خط ۱۳۶:
[[رده:زبان‌شناسی رایانشی]]
[[رده:کاربردهای هوش مصنوعی]]
[[رده:وظیفه‌های پردازش زبان‌های طبیعی]]