متن‌کاوی: تفاوت میان نسخه‌ها

محتوای حذف‌شده محتوای افزوده‌شده
جز Yamaha5 صفحهٔ متن کاوی را به متن‌کاوی منتقل کرد
جز ←‏جایگزینی با [[وپ:اشتباه|اشتباه‌یاب]]: اصطلاحهایی⟸اصطلاح‌هایی
خط ۱۶:
* Named entity recognition از تکنیکهای اماری جهت شناختن نامها استفاده می‌کند: مردم، سازمانها، نام مکانها، اختصارهای خاص و غیره. ابهام زدایی – با استفاده از راهنماهای متنی –ممکن است نیاز شود برای آنکه تعیین گردد کلمه “Ford” می‌تواند به یک رئیس جمهور سابق آمریکا، یک کارخانه خودروسازی، یک ستاره سینما، یک رودخانه یا موجودیتی دیگر ارجاع داشته باشد.
* تشخیص الگوی تعیین شده موجودیت: ویژگی‌هایی مانند شماره تلفن، آدرس ایمیل، مقادیر (همراه با واحد) می‌توانند از طریق regular expression یا دیگر الگوهای تطبیق داده شود.
* Coreference: شناسایی گروه اسمی و دیگر اصطلاحهاییاصطلاح‌هایی که به شی ای یکسان ارجاع دارند.
* استخراج ارتباط، حقیقت و رخداد: تشخیص همبستگی بین موجودیت‌ها و دیگر اطلاعات درون متن.
* آنالیز نیت، درگیر در فهم ذهنی (نه حقیقی) اجزاء و استخراج فرمهای مختلف نگرشی اطلاعات مانند احساس، عقیده، حالت و هیجان است. تکنیکهای آنالیز متن در آنالیز کردن نیت و مقصود موجودیتها، مفاهیم یا سطح موضوع و در تشخیص عقیده و نظر اجزاء کمک کننده هستند.