متنکاوی: تفاوت میان نسخهها
محتوای حذفشده محتوای افزودهشده
جز ←جایگزینی با [[وپ:اشتباه|اشتباهیاب]]: اصطلاحهایی⟸اصطلاحهایی |
|||
خط ۱۶:
* Named entity recognition از تکنیکهای اماری جهت شناختن نامها استفاده میکند: مردم، سازمانها، نام مکانها، اختصارهای خاص و غیره. ابهام زدایی – با استفاده از راهنماهای متنی –ممکن است نیاز شود برای آنکه تعیین گردد کلمه “Ford” میتواند به یک رئیس جمهور سابق آمریکا، یک کارخانه خودروسازی، یک ستاره سینما، یک رودخانه یا موجودیتی دیگر ارجاع داشته باشد.
* تشخیص الگوی تعیین شده موجودیت: ویژگیهایی مانند شماره تلفن، آدرس ایمیل، مقادیر (همراه با واحد) میتوانند از طریق regular expression یا دیگر الگوهای تطبیق داده شود.
* Coreference: شناسایی گروه اسمی و دیگر
* استخراج ارتباط، حقیقت و رخداد: تشخیص همبستگی بین موجودیتها و دیگر اطلاعات درون متن.
* آنالیز نیت، درگیر در فهم ذهنی (نه حقیقی) اجزاء و استخراج فرمهای مختلف نگرشی اطلاعات مانند احساس، عقیده، حالت و هیجان است. تکنیکهای آنالیز متن در آنالیز کردن نیت و مقصود موجودیتها، مفاهیم یا سطح موضوع و در تشخیص عقیده و نظر اجزاء کمک کننده هستند.
|