ترجمه ماشینی: تفاوت میان نسخهها
محتوای حذفشده محتوای افزودهشده
جز ربات ردهٔ همسنگ (۳۰) +املا+مرتب+تمیز (۱۴.۹ core): + رده:وظیفههای پردازش زبانهای طبیعی |
|||
خط ۲:
در سطح مقدماتی، ترجمه ماشینی یک جایگزینی ساده برای کلمات از زبان طبیعی به زبان دیگری است. با استفاده از تکنیکهای [[زبانشناسی پیکرهای]]، ترجمههای پیچیده بیشتری قابل دستیابی هستند. همچنین این تکنیکها کنترل بهتر تفاوتهای گونهشناسی در زبان، تشخیص عبارات و ترجمهٔ اصطلاحات را به خوبی و درستی جدا کردن عبارات نامتعارف در متن، مقدور میسازند.
[[نرمافزار
این تکنیک بطور خاص در حوزهٔ رسمی یا زبانهای فرموله شده استفاده میشود. این بدین معنی است که ترجمه ماشینی از اسناد قانونی و دولتی آسانتر از تولید خروجی قابل استفاده از مکالمات یا متون غیر چهارچوب بندی شده دیگر است.
همچنین کیفیت خروجی بهبود یافته میتواند با استفاده از دخالت انسان بدست آید. برای مثال سیستمهایی موجودند که اگر کاربر بطور کاملاً واضحی کلماتی که اسامی خاص هستند را معین کرده باشد، قادر به ترجمه دقیقتری هستند. با کمک گرفتن از این تکنیکها ترجمه ماشینی بعنوان یک ابزار برای کمک کردن به مترجمان (انسانها) و بسیاری از موضوعهای محدود، قادر به تولید خروجی قابل استفاده و نهایی است.
خط ۱۸:
# [[کدگذاری]] دوباره این معنا در زبان مقصد
در پس این فرایند بظاهر آسان، عملیات [[شناخت
از آن جهت، چالشی در ترجمه ماشینی وجود دارد که چگونه
این مسئله ممکن است به روشهای مختلفی انجام شود.
خط ۳۰:
با توجه به طبیعت نمایش واسطه، یک روش به عنوان ترجمه ماشینی بین زبانی<ref>interlingual machine translation</ref> یا ترجمه ماشینی مبتنی بر انتقال<ref>transfer-based machine translation</ref> معرفی میشود. این روشها نیاز به [[واژگان]] وسیعی با اطلاعات [[تکواژشناسی]]، [[دستور زبان]] و [[معناشناسی]] دارند.
با دادن دادههای کافی [[نرمافزار
دشواری کار ترجمه خودکار، بدست آوردن اطلاعات کافی از نوع صحیح آن برای پشتیبانی روشی خاص است. به عنوان مثال یک پیکره وسیع چند زبانی از دادهها، برای روشهای آماری مورد نیاز است، حال آنکه برای روشهای مبتنی بر دستورزبان لازم نیست. اما از سویی دیگر روشهای مبتنی بر دستورزبان نیاز به یک زبانشناس حرفهای برای طراحی دقیق دستورزبانی که استفاده خواهد شد، دارند.
برای ترجمه بین زبانهای نزدیک بهم، تکنیکی به نام [[ترجمه ماشینی مبتنی بر انتقال]] سطحی<ref>shallow-transfer machine translation</ref> ممکن است استفاده شود.
خط ۵۸:
قوانین برای پیش-پردازش دادهها برای هدایت بهتر موتور آماری استفاده میشوند. قوانین همچنین برای پس-پردازش خروجی موتور آماری برای پیادهسازی عملیاتی همچون نرمال سازی استفاده میشوند. این روش قدرت، کنترل و [[انعطافپذیری]] بسیار بیشتری دارد.
=== رمزگشایی ===
در سال های اخیر [[دانشگاه کالیفرنیای جنوبی]] (USC) بر روی روشهایی تمرکز کرده اند که ایده های اولیه آن از [[رمزنگاری]] استخراج شده اند. این روش هنوز در سطح تحقیقات اولیه است و تا رسیدن به یک روش قابل قبول فاصله زیادی باقی است. اما در صورت تحقق این روش ادعای [[وارن ویور]] که ترجمه ماشینی را تنها روشی برای رمزگشایی از متن رمزشده زبان مبدا در زبان مقصد می دانست، تحقق خواهد یافت.
مدل ترجمه در این روش بدون داده موازی از روی [[پیکره های نظیر]] آموزش داده می شوند و لذا در صورت تحقق تحولی شگرفت در
== مسئلههای اصلی ==
خط ۹۰:
با اینکه هیچیک از سیستمها، خلاصهای بدون خطا، تمام خودکار و با کیفیت بالا نمیتوانند تولید کنند، بسیاری از سیستمهای تمام خودکار، خروجی منطقی ای را تولید میکنند.<ref>[http://www.benjamins.com/cgi-bin/t_bookview.cgi?bookid=BTL%2014 Melby, Alan. The Possibility of Language (Amsterdam:Benjamins, 1995, 27-41)]</ref><ref>[http://tandibusiness.blogspot.com/2006/02/simple-model-outlining-translation.html Wooten, Adam. "A Simple Model Outlining Translation Technology" T&I Business (February 14, 2006)]</ref><ref>[http://www.mt-archive.info/Bar-Hillel-1960-App3.pdf Appendix III of 'The present status of automatic translation of languages', Advances in Computers, vol.1 (1960), p.158-163. Reprinted in Y.Bar-Hillel: Language and information (Reading, Mass. : Addison-Wesley, 1964), p.174-179.]</ref> کیفیت ترجمه ماشینی اگر حوزهٔ موضوعی متن محدود و کنترل شده باشد، اساساً بهتر خواهد شد.
با وجود محدودیتهای موروثی، نرمافزارهای ترجمه ماشینی در سرتاسر جهان مورد استفاده میباشند. احتمالاً بزرگترین مؤسسه استفاده کننده از این نرمافزارها [[کمیسیون اروپا
تاگل تکست(Toggletext)، یک سیستم مبتنی بر انتقال است که زبان [[زبان انگلیسی|انگلیسی]] را به [[زبان اندونزیایی|اندونزیایی]] ترجمه میکند.
خط ۱۳۶:
[[رده:زبانشناسی رایانشی]]
[[رده:کاربردهای هوش مصنوعی]]
[[رده:وظیفههای پردازش زبانهای طبیعی]]
|