غلط‌یاب: تفاوت میان نسخه‌ها

محتوای حذف‌شده محتوای افزوده‌شده
Fatemibot (بحث | مشارکت‌ها)
Mightyscience (بحث | مشارکت‌ها)
جز روش های جدیدتر برای خطایابی اضافه شد
خط ۳:
== عمل‌کرد''' ==
غلط‌یابهای ساده، کلمات خارج از متن را، جدا گانه در محتویات یک لغتنامه، یکی یکی مقایسه میکنند.در غلط‌یابی یک کلمه، اگر کلمه ای یافت نشد خطا به وجود می آید ودر صورت تکرار دستور، نرم‌افزار نزدیکترین کلمهٔ موجود را به عنوان جواب ترجمه میکند، برای این کار الگوریتم‌های زیادی پیشنهاد شده که ٔ یکی از آنها کلمات موجود در لغت نامه را که [[فاصله لون‌اشتاین]] کوچکی از کلمهٔ اصلی دارند لیست میکند.
در اغلب نرم‌افزارهای غلط‌یاب گزینه ای تعبیه شده که در صورت عدم وجود کلمه در لغت نامه، آن را (به استثنای موارد فلگ شده)به لیست کلمات شناخته شده اضافه میکند. روشهای جدیدتر برای غلط یابی اما ممکن است از الگوریتمهای پیچیده تری همچون یادگیری ماشین استفاده نمایند. به عنوان مثال این روشها می توانند الگوی خطای یک کاربر را شناخته و خود را با آن تطبیق دهند <ref>QasemiZadeh, B.; Ilkhani, A. & Ganjeii, A.
Adaptive Language Independent Spell Checking Using Intelligent Traverse on a Tree. IEEE Conference on Cybernetics and Intelligent Systems (CIS), IEEE, 2006, pp. 1-6</ref[http://pars.ie/publications/papers/pre-prints/adaptive-spell-checking.pdf Adaptive Language Independent Spell Checking Using Intelligent Traverse on a Tree]توجهی داشته باشد.
 
== طراحی''' ==
غلط‌یاب بطور عادی از دو قسمت تشکیل شده:
# مجموعه ای از اعمال که متن را پیمایش و کلمات را استخراج می‌کنند.
# الگوریتمی برای مقایسهٔ کلمات استخراج شده از متن با لیستی از کلمات که دارای هجای صحیح هستند(مثلاً: کلمات یک لغت‌نامه)
 
اعمال پیمایشی گاهی اوقات شامل الگوریتم‌های مستقل از زبان برای بررسی ریخت‌شناسی کلمات می‌شوند. اعمال استخراج کلمه، حتی برای زبانی مثل انگلیسی که گرامر آسانی دارد، به مواردی همچون اختصار و حالت مضاف احتیاج پیدا خواهند کرد. البته مشخص نیست که تحلیل (کاوش کلمات) مبتنی بر ریخت‌شناسی (مورفولوژی) تاثیر قابل توجهی داشته باشد.
 
لیست کلمات می‌تواند لیستی از کلمات ساده باشد یا اطلاعات اضافه‌تری مثل خط تیره‌گذاری، نشانه‌های لغوی و گرامری را نیز شامل شود. [//fa.wikipedia.org/wiki/واسط_کاربر واسط کاربری برنامه]، به عنوان قسمت الحاقی به این دو جز، به کاربران این امکان را می‌دهد که جابه‌جایی‌ها را آزمایش (موافقت) و عملیات برنامه را اصلاح کنند. البته استثنائی در مورد مثال بالا وجود دارد برنامه‌های غلط‌یابی که تنها از اطلاعات آماری استفاده می‌کنند: مثلاً استفاده از[//en.wikipedia.org/wiki/N-gram N-gram] این روش معمولاً هم تلاش زیادی برای دسترسی به اطلاعات آماری مورد نیاز می‌طلبد و هم‌زمان ذخیره‌سازی اطلاعات در آن بیش‌تر است به همین دلیل این روش‌ها عموماً کاربرد ندارند. در بعضی موارد برنامه‌های غلط‌یاب از لیست ثابتی از غلط‌های املایی و پیشنهادهایی برای اصلاحشان استفاده می‌کنند. این شیوه نسبت به شیوه‌های قبلی انعطاف کم‌تری دارد و اغلب در روش‌های اصلاح مبتنی بر کاغذ استفاده می‌شود مثل مدخل‌ها در لغت‌نامه‌ها