غلطیاب: تفاوت میان نسخهها
محتوای حذفشده محتوای افزودهشده
123tiny321 (بحث | مشارکتها) جز ←جایگزینی با [[وپ:اشتباه|اشتباهیاب]]: تشحیص⟸تشخیص، غلطیاب⟸غلطیاب، میکنید⟸می کنید |
جز v1.39b - Fixed using ویکیپدیا:ویکیپروژه تصحیح ویکیپدیا (زیربخشهای پررنگ شده - دارای پیوندهای داخلی به صورت پیوند بیرونی) برچسب: WPCleaner |
||
خط ۱:
'''غلطیاب'''، در دنیای محاسبات [[رایانه]]ای، برنامهای کاربردی است که کلمات یک متن را که دارای غلط املایی هستند، تشخیص میدهد. غلطیابها میتوانند به تنهایی روی بلوکی از یک متن یا به عنوان بخشی از یک برنامه بزرگتر، مانند واژهپرداز، [[نرمافزار]] ایمیل، لغتنامهٔ الکترونیک و یا موتور جستجو به کار روند.
== عملکرد
غلطیابهای ساده، کلمات خارج از متن را، جدا گانه در محتویات یک لغتنامه، یکی یکی مقایسه میکنند.در غلطیابی یک کلمه، اگر کلمه ای یافت نشد خطا به وجود می آید ودر صورت تکرار دستور، نرمافزار نزدیکترین کلمهٔ موجود را به عنوان جواب ترجمه میکند، برای این کار الگوریتمهای زیادی پیشنهاد شده که ٔ یکی از آنها کلمات موجود در لغت نامه را که [[فاصله لوناشتاین]] کوچکی از کلمهٔ اصلی دارند لیست میکند.
در اغلب نرمافزارهای غلطیاب گزینه ای تعبیه شده که در صورت عدم وجود کلمه در لغت نامه، آن را (به استثنای موارد فلگ شده)به لیست کلمات شناخته شده اضافه میکند. روشهای جدیدتر برای غلط یابی اما ممکن است از الگوریتمهای پیچیده تری همچون یادگیری ماشین استفاده نمایند. به عنوان مثال این روشها می توانند الگوی خطای یک کاربر را شناخته و خود را با آن تطبیق دهند<ref>QasemiZadeh, B.; Ilkhani, A. & Ganjeii, A, Adaptive [http://pars.ie/publications/papers/pre-prints/adaptive-spell-checking.pdf Language Independent Spell Checking Using Intelligent Traverse on a Tree]. IEEE, 2006, pp. 1-6 </ref>.
== طراحی
غلطیاب بطور عادی از دو قسمت تشکیل شده:
# مجموعه ای از اعمال که متن را پیمایش و کلمات را استخراج میکنند.
خط ۱۲:
اعمال پیمایشی گاهی اوقات شامل الگوریتمهای مستقل از زبان برای بررسی ریختشناسی کلمات میشوند. اعمال استخراج کلمه، حتی برای زبانی مثل انگلیسی که گرامر آسانی دارد، به مواردی همچون اختصار و حالت مضاف احتیاج پیدا خواهند کرد. البته مشخص نیست که تحلیل (کاوش کلمات) مبتنی بر ریختشناسی (مورفولوژی) تاثیر قابل توجهی داشته باشد.
لیست کلمات میتواند لیستی از کلمات ساده باشد یا اطلاعات اضافهتری مثل خط تیرهگذاری، نشانههای لغوی و گرامری را نیز شامل شود. [
== تاریخچه
اولین غلطیابها به صورت گسترده در اواخر دههٔ ۷۰ روی کامپیوترهای مرکزی استفاده شدند.چند سال بعد گروهی متشکل از ۶ زبانشناس از [
غلط یابها برای اولین بار در کامپیوترهای شخصی [//en.wikipedia.org/wiki/CP/M CP/M] و
[//en.wikipedia.org/wiki/TRS-80 TRS-80] در سال ۱۹۸۰ و یک سال بعد در ۱۹۸۱ در همهٔ پکیجهای سری IBM PC مورد استفاده قرار گرفتند.توسعه دهندگان دیگر نیز همزمان با توسعهٔ سریع بازار نرمافزار به سمت تولید پکیجهای [//en.wikipedia.org/w/index.php?title=Special:Search&search=OEM&fulltext=Search OEM] و محصولات
[//en.wikipedia.org/wiki/End-user_(computer_science) end-user]برای استفاده در رایانههای شخصی، [
با وجود این پکیجهای غلطیاب تنها مدت کمی مورد استقبال قرار گرفت، در اواسط دههٔ ۱۹۸۰ توسعه دهندگان بزرگ بستههای نرمافزاری واژه پرداز، مثل Word Star وWord Perfect غلط یابها را به صورت رسمی در پکیجهای محصولاتشان ثبت کردند ودر عرض مدت کوتاهی آن را از انگلیسی به زبانهای اروپایی و حتی آسیایی نیز گسترش دادند، علیرغم توسعههای مزبور، محصول جدید هنوز در قسمتهای ریختشناسی و ریشه شناسی، ناقص بودو این نقص مخصوصا در زبانهایی مثل بلغاری و فنلاندی که مملو از ترکیب ریشهها است، دوچندان ایجاد مشکل میکرد. هرچند که نتیجهٔ سرمایه گذاری برای عرضهٔ واژه پردازهای شامل غلطیاب، دربازار کشوری مثل ایسلند توجیه اقتصادی نداشت با این حال کمپانی هایی مثل : word perfect در راستای استراتژی جهانی سازی محصولاتشان، به تلاش خود ادامه میدادند تا بازار کشورهای بیشتری را به تسخیر درآورند.
به تازگی، استفاده از غلط یابها به جز واژه پرداز ها، به دنیای مرورگرهای وب نیز راهٔ یافته، از آن جمله میتوان به
[//en.wikipedia.org/wiki/Mozilla_Firefox_2 Firefox2.0 ] اشاره کرد که به کاربر این امکان را میدهد تا در حین تایپ کلمات از غلط یاب استفاده کند، وقتی که در حال ویرایش ویکی متن، نوشتن در سایتهای ارائه دهندهٔ ایمیل، نوشتن در بلاگها و شبکههای اجتماعی هستید دارید از غلطیاب استفاده می کنید، همچنین برنامههای مرورگر وبی مثل : [
[
== عاملیت ==
خط ۲۸:
به نظر منطقی میرسد که بررسی کنیم و ببینیم که دیکشنریهای دارای غلط یاب کجاها بیشتر مورد استقبال عموم قرار میگیرند.
به طور کلی هرچه دیکشنری مزبور بزرگتر باشد بهتر است، طوری که کلمات درست، اشتباهاً نادرست تلقی نشوند، با این وجود در عمل یک دیکشنری مطلوب انگلیسی باید حدوداً ۹۰۰۰۰ مدخل داشته باشد، اگر تعداد بیشتری وجود داشته باشد ممکن است کلماتی که غلط هجی شدهاند به دلیل این که در بقیه زبانها اشتباه محسوب شدهاند به طورکلی نادیده گرفته شوند. برای مثال یک زبانشناس باید با تکیه بر دانش [//en.wikipedia.org/wiki/Corpus_linguistics زبانشناسی اصل گرا] به درستی تشخیص دهد که کلمهٔ " baht " اغلب حاصل هجای غلط کلمهٔ " bath " است که یک اشتباه رایج سهوی و نوشتاری تایلندیها میباشد، از طرفی همین کلمه با کمی تغییر، تبدیل به " baths " میشود که در فرهنگ انگلیسی به معنای حمامی عمومی است که مورد استفادهٔ طبی دارد. پس معقول تر به نظر میرسد که عدهٔ کمی از افراد که تایلندی مینویسند، کمی در هنگام نوشتن به زحمت بیافتند تا این که عدهٔ زیادتری به خاطر حذف کلمهٔ " baths " که کلمهای درست محسوب میشود، دچار مشکل نشوند.
اولین سری از غلط یابهای [
در سالهای اخیر کیفیت نرمافزارهای غلط یاب رشد بسیار زیادی داشته به طوری که بعضی از آنها میتوانند خطاهای سادهٔ گرامری را تشخیص دهند.
== غلط یابی در زبانهای غیر انگلیسی
اغلب کلمات زبان انگلیسی که در گونهٔ نوشتاری و رسمی به کار میروند و تک هجایی هستند، در یک دیکشنری معمولی یافت میشوند، تنها بعضی از لغات فنی و کلمات اصلاح شده از این قائده مستثنی هستند .دربعضی زبانها ترکیب لغات برای ساختن لغات جدید یک اصل رایج است مثلاً در زبان آلمانی اسامی مرکب اغلب با ترکیب و تغییر کلمههای موجود تولید میشوند، بعضی از ساختارهای نوشتاری زبان نمیتوانند تفاوت کلمه ای را از دیگری به وضوح نمایش دهند بنابراین در این گونه موارد به الگوریتمهای جدا کنندهٔ کلمات احتیاج پیدا خواهد شد.با این تفاسیر هر کدام از این مسائل چالشهای تازه تری را برای تولید غلط یابها به زبانهای غیر انگلیسی تولید میکند .
خط ۴۱:
افراد در اثر استفاده از ابزار پیشرفته کاهش مییابد. "
== جستارهای وابسته
{{چپچین}}
* Grammar checker
خط ۵۰:
{{پایان چپچین}}
== منابع
{{چپچین}}
خط ۷۰:
{{پایان چپچین}}
== پیوند به بیرون
{{چپچین}}
|