بازیابی اطلاعات: تفاوت میان نسخه‌ها

محتوای حذف‌شده محتوای افزوده‌شده
جز ←‏جایگزینی با [[وپ:اشتباه|اشتباه‌یاب]]: ساختارنایافته‌است⟸ساختار نایافته‌است
FreshmanBot (بحث | مشارکت‌ها)
جز ←‏مدل‌سازی اطلاعات: اصلاح فاصله مجازی + اصلاح نویسه با ویرایشگر خودکار فارسی
خط ۱۹:
نخستین گام در بازیابی اطلاعات، مدل‌سازی اطلاعات و توصیف و تعریف ارتباط موجود میان اجزاء منبع اطلاعاتی با نیازهای اطلاعاتی کاربر است. سه مدل مهم در حوزهٔ بازیابی اطلاعات عبارت است از:
* [[مدل دودویی]] (یا دوگانی): در مدل دودویی (یا دوگانی) هر [[سند (مدرک)|سند]] (''document'') به صورت کیفی پر از کلمات (''bag of words'') در نظر گرفته می‌شود.
* [[مدل برداری|مدل بُرداری]]: در مدل بُرداری، هر سند به صورت برداری از کلمات در یک [[فضای برداری]] چند بُعدی در نظر گرفته می‌شود که ابعاد آن را کلمات تشکیل می‌دهند. مولفه‌هایمؤلفه‌های این بردار سند، در واقع وزن‌هایی هستند که نشان می‌دهند هر یک از کلمات چقدر در متمایز کردن آن سند دخیل هستند.
* [[مدل احتمالاتی]]: در مدل احتمالاتی، به هر سند [[احتمال|احتمالی]] اختصاص داده می‌شود که مربوط بودن آن مستند را به نیاز کاربر به صورت احتمال بین صفر و یک بیان می‌کند.