باز کردن منو اصلی

تغییرات

جز
اصلاح فاصله مجازی + اصلاح نویسه با ویرایشگر خودکار فارسی
 
[[نرم‌افزار]]های ترجمه ماشینی کنونی اغلب به کاربر اجازهٔ تغییر دلخواه بر اساس حوزه کاری یا حرفه‌ای دلخواه را می‌دهند (همانند [[هواشناسی|گزارش آب و هوا]]). در واقع ارتقاء کیفیت خروجی با استفاده از محدود کردن کلمات جایگزین شونده، انجام می‌شود.
این تکنیک بطوربه‌طور خاص در حوزهٔ رسمی یا زبانهایزبان‌های فرموله شده‌استفاده می‌شود. این بدین معنی است که ترجمه ماشینی از اسناد قانونی و دولتی آسان‌تر از تولید خروجی قابل استفاده از مکالمات یا متون غیر چهارچوب بندی شده دیگر است.
همچنین کیفیت خروجی بهبود یافته می‌تواند با استفاده از دخالت انسان بدست آید. برای مثال سیستم‌هایی موجودند که اگر کاربر بطوربه‌طور کاملاً واضحی کلماتی که اسامی خاص هستند را معین کرده باشد، قادر به ترجمه دقیق‌تری هستند. با کمک گرفتن از این تکنیک‌ها ترجمه ماشینی به عنوان یک ابزار برای کمک کردن به مترجمان (انسان‌ها) و بسیاری از موضوع‌های محدود، قادر به تولید خروجی قابل استفاده و نهایی است.
 
در ترجمهٔ ماشینی ویژگی‌هایی وجود دارد که نه تنها از نظر جاذبه و کشش علمی، بلکه، از دیدگاه [[علم اقتصاد|اقتصادی]] و دیگر ضرورت‌ها و اقتضاهای عصر، انجام آن را کاملاً توجیه می‌کند. به عنوان مثال، در مقر [[سازمان ناتو]] در [[بروکسل]] و جامعه اروپا علی‌رغم آنکه حدود ۱۲۰۰ مترجم ورزیده به کار اشتغال دارند، در حال حاضر از ترجمه ماشینی نیز استفاده می‌شود. دلیل این امر سرعت و هزینه‌است. میزان کاری که مترجمی ورزیده در خلال چندین روز انجام می‌دهد، توسط کامپیوتر در عرض چند دقیقه انجام می‌شود. حتی اگر کیفیت و دقت ترجمه ماشینی کمتر از حاصل کار [[مترجم]] باشد، باز هم از جهات گوناگون اهمیت و ارزش خاص آن چشمگیر است.
 
== تاریخچه ==
[[ترجمه|ترجمهٔ]] ماشینی از جملهٔ اولین اهداف مورد نظر در [[علوم رایانه]] و بخصوص در حوزهٔ [[هوش مصنوعی|هوش ماشینی]] به حساب می‌آید و سابقهٔ آن به حدود نیم قرن پیش از این بازمی‌گردد. نخستین ترجمه‌ای که بطوربه‌طور کامل توسط [[کامپیوتر]] انجام شد، ترجمهٔ متنی بود از [[زبان انگلیسی]] به [[زبان روسی]]. گر چه از آن زمان تاکنون فناوری ترجمهٔ ماشینی رشد زیادی داشته‌است، هنوز هم نقص‌های فراوانی را داراست. اصولاً چون کامپیوترها نمی‌توانند مانند انسان هوشمند باشند، ترجمه‌ای هم که توسط آن‌ها انجام شود، ترجمهٔ کاملی نخواهد بود. نمی‌توان انتظار داشت که با استفاده از یک [[نرم‌افزار مترجم]]، هر متنی به آسانی ترجمه شود. نرم‌افزارهای مترجم، در بهترین حالت، عمل ترجمه را با دقتی در حدود ۷۰ درصد انجام می‌دهند. برای به دست آوردن نتیجه بهتر، لازم است قبل و بعد از ترجمه، مقداری ویرایش روی متن انجام شود.
 
در طی چند دههٔ اخیر و هم‌زمان با گسترش و پیشرفت [[زبان‌شناسی محاسباتی|زبان‌شناسی رایانه‌ای]]، در بسیاری از [[کشورهای جهان]]، تلاشهایتلاش‌های همه‌جانبه و پیگیر در جهت ترجمهٔ متون از طریق کامپیوتر انجام گرفته، و حاصل کار با توجه به تنگناها، محدودیت‌ها، و مسائل خاص ترجمه درخور توجه‌است. در بعضی از زمینه‌ها حاصل کار واقعاً رضایت‌بخش است، ولی، در برخی موارد نتایج به دست آمده را علی‌رغم قابل فهم بودن، باید ویراستاری کرد. طبیعتاً نوع متن و میزان پیچیدگی آن اهمیت زیادی در نتیجه کار دارد.
 
== فرایند ترجمه ==
 
=== روش بین زبانی ===
ترجمه ماشینی بین زبانی نمونه‌ای از ترجمه ماشینی قاعده‌مند است. در این روش، متن به زبان مبدأ به یک متن بین زبانی (بعنوان مثال، زبانهایزبان‌های بین‌المللی کمکی همانند [[اسپرانتو]]) که مستقل از زبان مقصد است، تبدیل می‌شود. سپس متن به زبان مقصد از متن بین زبانی، تولید خواهد شد.
 
=== روش مبتنی بر فرهنگ لغت ===
ترجمه ماشینی به روش آماری، سعی در تولید ترجمه‌هایی دارد که از روش‌های آماری مبتنی بر [[پیکره‌های متنی دوزبانی]] استفاده می‌کنند. همانند [[پیکره کانادایی هانسارد]](Canadian Hansard corpus)، بایگانی انگلیسی-فرانسوی مجلس کانادا و یوروپارل(EUROPARL) و بایگانی [[پارلمان اروپا]].
 
درحال حاضر این چنین پیکره‌هایی موجودند و نتایج ثمربخشی از ترجمه متون از نوع مشابهی، بدست می‌آید اما این چنین پیکره‌ای هنوز بسیار کمیاب است. اولین نرم‌افزار آماری ترجمه ماشینی، کاندید(CANDIDE) تولیدی شرکت [[آی‌بی‌ام]] بود. [[گوگل]] نیز سیسترن(SYSTRAN) را برای سال‌های متمادی استفاده کرد اما نهایتاً در اکتبر ۲۰۰۷ به مترجمی آماری تغییر روش داد. به تازگی، گوگل قابلیت‌های ترجمه خود را بوسیلهبه وسیلهٔ دادن ۲۰۰ میلیون کلمه از اسناد [[سازمان ملل]] به عنوان ورودی سیستم-برای تعلیم سیستم خود- بهبود بخشیده‌اند. و بدین سان دقت ترجمه‌ها بهبود یافته‌است.<ref>[http://blog.outer-court.com/archive/2005-05-22-n83.html Google Translator: The Universal Language<!-- Bot generated title -->]</ref>
 
=== روش مبتنی بر مثال ===
روش پیوندی، قدرتمندی دو روش آماری و قاعده‌مند را باهم ادغام می‌کند.<ref name="speechtechmag.com">[http://www.speechtechmag.com/Articles/News/News-Feature/AppTek-Launches-Hybrid-Machine-Translation-Software-52871.aspx Boretz, Adam, "AppTek Launches Hybrid Machine Translation Software" SpeechTechMag.com (posted 2 MAR 2009)]</ref> بسیاری از شرکت‌های ترجمه ماشینی (همانند آسیا آنلاین و سیسترن(SYSTRAN)) مدعی داشتن روشی چندگانه مبتنی بر دو روش قاعده‌مند و آماری در ترجمه ماشینی، هستند. این روش‌ها به دو گونه مختلف زیر می‌باشند:
* '''قوانین در مرحله دوم توسط روش‌های آماری پردازش می‌شوند'''
در این روش ترجمه بوسیلهبه وسیلهٔ موتورهای قاعده‌مند انجام می‌شود. سپس معیارهای آماری برای تنظیم/تصحیح خروجی موتور قاعده‌مند اعمال می‌شوند.
* '''معیارهای آماری از ابتدا توسط قوانین هدایت می‌شوند'''
قوانین برای پیش-پردازش داده‌ها برای هدایت بهتر موتور آماری استفاده می‌شوند. قوانین همچنین برای پس-پردازش خروجی موتور آماری برای پیاده‌سازی عملیاتی همچون نرمال‌سازی استفاده می‌شوند. این روش قدرت، کنترل و [[انعطاف‌پذیری]] بسیار بیشتری دارد.
 
=== رمزگشایی ===
در سال‌های اخیر [[دانشگاه کالیفرنیای جنوبی]] (USC) بر روی روشهاییروش‌هایی تمرکز کرده‌اند که ایده‌های اولیه آن از [[رمزنگاری]] استخراج شده‌اند. این روش هنوز در سطح تحقیقات اولیه است و تا رسیدن به یک روش قابل قبول فاصله زیادی باقی است. اما در صورت تحقق این روش ادعای [[وارن ویور]] که ترجمه ماشینی را تنها روشی برای رمزگشایی از متن رمز شده زبان مبدأ در زبان مقصد می‌دانست، تحقق خواهد یافت.
مدل ترجمه در این روش بدون داده موازی از روی [[پیکره‌های نظیر]] آموزش داده می‌شوند و لذا در صورت تحقق تحولی شگرفت در فرایند ترجمه بخصوص برای زبانهاییزبان‌هایی که دارای منابع زبانشناسی محدود هستند، خواهد بود.
 
== مسئله‌های اصلی ==
=== ابهام‌زدایی ===
ابهام‌زدایی از کلمات با یافتن ترجمه مناسب برای کلمه‌ای با بیش از یک معنی در ارتباط است. این مسئله اولین بار در سال ۱۹۵۰ توسط یهوشوا بار-هیلل (Yehoshua Bar-Hillel) مطرح شد.<ref>[http://ourworld.compuserve.com/homepages/WJHutchins/Miles-6.htm Milestones in machine translation - No.6: Bar-Hillel and the nonfeasibility of FAHQT] by John Hutchins</ref> او به این موضوع که بدون یک فرهنگ نامهٔ جهانی، یک ماشین هرگز نمی‌تواند بین دو معنی کلمه، معنی صحیح را تشخیص دهد، تکیه کرد. امروزه روش‌های بسیاری برای حل این مشکل بوجودبه وجود آمده‌اند که این روش‌ها بطوربه‌طور تقریبی به دو دستهٔ روش‌های «سطحی» و «عمقی» تقسیم می‌شوند.
روشهایروش‌های سطحی تصور می‌کنند که هیچ دانشی از متن ندارند. آن‌ها به سادگی روش‌های آماری را برای کلمات اطراف کلمه مبهم، اعمال می‌کنند. اما روش‌های عمقی دانشی وسیع از کلمه را متصور می‌شوند. تا بحال، روش‌های سطحی موفقیت بیشتری داشته‌اند.
آقای کلود پایرون(Claude Piron)، یکی از مترجم‌های بسیار قدیمی [[سازمان ملل]] و [[سازمان بهداشت جهانی]]، نوشته‌است که ترجمهٔ ماشینی، در بهترین نوع آن، آسان‌ترین بخش کار مترجمان را می‌تواند انجام دهد. بخش سخت‌تر و زمان‌گیر معمولاً در ارتباط با تشخیص ابهامات متن منبع است که این عمل نیاز به برطرف کردن آشفتگی‌های دستور زبانی و لغوی زبان مقصد دارد.<ref name="piron">[[کلود پیرون]]، ''Le défi des langues'' (The Language Challenge), Paris, L'Harmattan, 1994. <!-- GFDL translation by Jim Henry --></ref>
 
* ورد لینگو (Worldlingo): مترجمی که بر مبنای دو روش آماری و قاعده‌مند کار می‌کند (همانند مترجم [[مایکروسافت آفیس]]).
* سیسترن:<ref>SYSTRAN: http://en.wikipedia.org/wiki/SYSTRAN</ref> همان سیستم [[یاهو]]! بیبل فیش (Yahoo! Babel Fish).
* پرامت (Promt): سرویسهایسرویس‌های ترجمهٔ آنلاین در Voila.fr و Orange.fr
* اپتک:<ref>Apptek: http://en.wikipedia.org/wiki/Apptek</ref> یک سیستم مترجم خودکار چندگانه (در سال ۲۰۰۹ ارائه شد)
* ایدوماکس:<ref>IdiomaX: http://en.wikipedia.org/wiki/IdiomaX</ref> سرویسهایسرویس‌های مترجم آنلاین در idiomax.com
با اینکه هیچ‌یک از سیستم‌ها، خلاصه‌ای بدون خطا، تمام خودکار و با کیفیت بالا نمی‌توانند تولید کنند، بسیاری از سیستم‌های تمام خودکار، خروجی منطقی ای را تولید می‌کنند.<ref>[http://www.benjamins.com/cgi-bin/t_bookview.cgi?bookid=BTL%2014 Melby, Alan. The Possibility of Language (Amsterdam:Benjamins, 1995, 27-41)]</ref><ref>[http://tandibusiness.blogspot.com/2006/02/simple-model-outlining-translation.html Wooten, Adam. "A Simple Model Outlining Translation Technology" T&I Business (February 14, 2006)]</ref><ref>[http://www.mt-archive.info/Bar-Hillel-1960-App3.pdf Appendix III of 'The present status of automatic translation of languages', Advances in Computers, vol.1 (1960), p.158-163. Reprinted in Y.Bar-Hillel: Language and information (Reading, Mass. : Addison-Wesley, 1964), p.174-179.]</ref> کیفیت ترجمه ماشینی اگر حوزهٔ موضوعی متن محدود و کنترل شده باشد، اساساً بهتر خواهد شد.
با وجود محدودیت‌های موروثی، نرم‌افزارهای ترجمه ماشینی در سرتاسر جهان مورد استفاده می‌باشند. احتمالاً بزرگترین مؤسسه استفاده‌کننده از این نرم‌افزارها [[کمیسیون اروپا]]ست. پروژه مولتو(MOLTO)، که بوسیلهبه وسیلهٔ [[دانشگاه گوتنبورگ]] ایجاد شده‌است، بیش از ۲٫۳۷ میلیون یورو به عنوان بودجهٔ حمایتی از [[اتحادیه اروپا]] برای ساخت ابزار مترجم قابل اطمینان دریافت کرده که بتواند بیشتر زبانهایزبان‌های اتحادیه اروپا را دربر بگیرد.
تاگل تکست(Toggletext)، یک سیستم مبتنی بر انتقال است که زبان [[زبان انگلیسی|انگلیسی]] را به [[زبان اندونزیایی|اندونزیایی]] ترجمه می‌کند.
 
[[گوگل]] ادعا کرده‌است که نتایجی که قولش را داده بود، بوسیلهبه وسیلهٔ استفاده از موتور [[ترجمه ماشینی آماری]] اش حاصل شده‌است.<ref>[http://googleblog.blogspot.com/2005/08/machines-do-translating.html Google Blog: The machines do the translating] (by [[Franz Och]])</ref> ترجمه آماری که در ابزار زبان گوگل (Google language tools) برای تبدیل بین زبانهایزبان‌های عربی، انگلیسی و بین چینی و انگلیسی استفاده شده‌است، امتیاز کلی ۰٫۴۲۸۱ را از مؤسسه ملی استاندارد و تکنولوژی گرفت که درقیاس با بلو-۴ شرکت آی بی ام که در تابستان ۲۰۰۶ امتیاز ۰٫۳۹۵۴ گرفته بود، برتری یافت.
 
با تمرکز امروزی تروریسم، منابع نظامی [[ایالات متحده آمریکا]] مبلغ بالایی را در مهندسی زبان طبیعی، [[سرمایه‌گذاری]] کرده‌اند. در حال حاضر [[نیروی نظامی]] به ترجمه و پردازش زبانهاییزبان‌هایی همانند [[زبان عربی|عربی]]، [[زبان پشتو|پشتو]] و[[زبان دری|دری]] علاقه‌مند است. دفتر پردازش [[فناوری اطلاعات]] [[دارپا]]، برنامه‌هایی همانند تایدز(TIDES)و مترجم [[بابیلون (نرم‌افزار)|بابیلون]] را میزبانی می‌کند. [[نیروی هوایی آمریکا]] نیز ۱میلیون دلار برای توسعه و ایجاد تکنولوژی ترجمه زبان، تعهد کرده‌است.<ref>[http://gcn.com/articles/2003/09/09/air-force-wants-to-build-a-universal-translator.aspx GCN — Air force wants to build a universal translator]</ref>
 
رشد جالب توجه [[شبکه‌های اجتماعی]]، همانند [[فیس بوک]] یا [[پیام‌رسان فوری|پیام‌رسان‌های فوری]] همانند اسکایپ(Skype)، گوگل تاک(Google Talk) و [[ام اس ان]] مسنجر(MSN Messenger)، در سال‌های اخیر، مورد استفادهٔ دیگری برای نرم‌افزارهای ترجمه ماشینی شده‌است. چراکه بدین وسیله کابران به زبان‌های مختلف می‌توانند با یکدیگر ارتباط برقرار کنند.
 
نرم‌افزارهای ترجمه ماشینی همچنین برای بسیاری از موبایلها، کامپیوترهای جیبی و.. عرضه شده‌است. بخاطر قابلیت حمل آنها، این‌گونه وسایل به عنوان ابزارهای ترجمه برای موبایل مشخص شده‌اند که شبکه تجارتی با استفاده از موبایل را بین شرکایی با زبانهایزبان‌های مختلف ممکن ساخته‌است. همچنین این نرم‌افزارها نیاز به مترجم انسان به عنوان واسطی در مکالمات دوطرف را از بین می‌برند.
 
== ارزیابی ترجمه خودکار در حوزه‌های مختلف ==
۱۳۳٬۲۴۲

ویرایش