غلطیاب: تفاوت میان نسخهها
محتوای حذفشده محتوای افزودهشده
جز ربات ردهٔ همسنگ (۲۶) +نشانی+مرتب (۸.۸): + رده:ویژگیهای ویرایشگر متن |
جز روش های جدیدتر برای خطایابی اضافه شد |
||
خط ۳:
== عملکرد''' ==
غلطیابهای ساده، کلمات خارج از متن را، جدا گانه در محتویات یک لغتنامه، یکی یکی مقایسه میکنند.در غلطیابی یک کلمه، اگر کلمه ای یافت نشد خطا به وجود می آید ودر صورت تکرار دستور، نرمافزار نزدیکترین کلمهٔ موجود را به عنوان جواب ترجمه میکند، برای این کار الگوریتمهای زیادی پیشنهاد شده که ٔ یکی از آنها کلمات موجود در لغت نامه را که [[فاصله لوناشتاین]] کوچکی از کلمهٔ اصلی دارند لیست میکند.
در اغلب نرمافزارهای غلطیاب گزینه ای تعبیه شده که در صورت عدم وجود کلمه در لغت نامه، آن را (به استثنای موارد فلگ شده)به لیست کلمات شناخته شده اضافه میکند. روشهای جدیدتر برای غلط یابی اما ممکن است از الگوریتمهای پیچیده تری همچون یادگیری ماشین استفاده نمایند. به عنوان مثال این روشها می توانند الگوی خطای یک کاربر را شناخته و خود را با آن تطبیق دهند <ref>QasemiZadeh, B.; Ilkhani, A. & Ganjeii, A.
Adaptive Language Independent Spell Checking Using Intelligent Traverse on a Tree. IEEE Conference on Cybernetics and Intelligent Systems (CIS), IEEE, 2006, pp. 1-6</ref[http://pars.ie/publications/papers/pre-prints/adaptive-spell-checking.pdf Adaptive Language Independent Spell Checking Using Intelligent Traverse on a Tree]توجهی داشته باشد.
لیست کلمات میتواند لیستی از کلمات ساده باشد یا اطلاعات اضافهتری مثل خط تیرهگذاری، نشانههای لغوی و گرامری را نیز شامل شود. [//fa.wikipedia.org/wiki/واسط_کاربر واسط کاربری برنامه]، به عنوان قسمت الحاقی به این دو جز، به کاربران این امکان را میدهد که جابهجاییها را آزمایش (موافقت) و عملیات برنامه را اصلاح کنند. البته استثنائی در مورد مثال بالا وجود دارد برنامههای غلطیابی که تنها از اطلاعات آماری استفاده میکنند: مثلاً استفاده از[//en.wikipedia.org/wiki/N-gram N-gram] این روش معمولاً هم تلاش زیادی برای دسترسی به اطلاعات آماری مورد نیاز میطلبد و همزمان ذخیرهسازی اطلاعات در آن بیشتر است به همین دلیل این روشها عموماً کاربرد ندارند. در بعضی موارد برنامههای غلطیاب از لیست ثابتی از غلطهای املایی و پیشنهادهایی برای اصلاحشان استفاده میکنند. این شیوه نسبت به شیوههای قبلی انعطاف کمتری دارد و اغلب در روشهای اصلاح مبتنی بر کاغذ استفاده میشود مثل مدخلها در لغتنامهها
|