وب پنهان: تفاوت میان نسخه‌ها

محتوای حذف‌شده محتوای افزوده‌شده
FreshmanBot (بحث | مشارکت‌ها)
جز اصلاح فاصله مجازی + اصلاح نویسه با استفاده از AWB
Iranam70 (بحث | مشارکت‌ها)
بدون خلاصۀ ویرایش
خط ۷:
در سال ۲۰۰۰، مایکل کی. برگمن گفت چگونه سرچ کردن در اینترنت را می‌توان با کشیدن یک شبکه در میان سطح یک اقیانوس مقایسه کرد: ممکن است که یک معامله خوبی در شبکه بدست بیاید، اما ثروتی از اطلاعات وجود دارد که عمیق و در نتیجه از دست رفته‌است. بسیاری از اطلاعات وب بسیار پایین در سایت‌ها دفن شده‌اند، و موتورهای جست و جوی استاندارد آن‌ها را پیدا نمی‌کنند. موتورهای جستجوی سنتی محتوای در دیپ وب را نمی‌توانند ببینند یا بازیابی کنند. بخشی از وب که توسط موتورهای جستجوی لیست شده به عنوان سرفیس وب (وب سطحی) شناخته می‌شود. در سال ۲۰۰۱، دیپ وب چندین برابر بزرگتر از سرفیس وب بود. یک مقایسه از کوه یخ توسط دنیس شستاکوف به ترتیب نشان دهندهٔ تفاوت بین سرفیس وب و دیپ وب است:
 
ایناندازه غیرممکنگرفتن استیا کهتخمین اندازهزدن گرفت،اندازه و سخت است که تخمین زد، اندازهٔعمق دیپ وب راکاری غیرممکن است. زیرا اکثر اطلاعاتپایگاه مخفیهای یاداده، دارای اطلاعات قفل شده درو پایگاه‌هایرمزگذاری دادهشده هستند. تخمین‌های اولیه نشان می‌دهد دیپ وب ۴۰۰ تا ۵۵۰ بار برگتر از سرفیس وب است. با این حال از آنجاکه همیشه اطلاعات و سایت‌های بیشتری در حال اضافه شدن است می‌توان فرض کرد که دیپ وب در حال رشد نمایی در نرخی است که نمی‌توان مقدار دهی کرد.
 
براوردهای مبتنی بر تعمیم دهی از یک مطالعه انجام شده در دانشگاه کالیفرنیا برکلی در سال ۲۰۰۱ اندیشید که دیپ وب حدوداً شامل ۷٫۵ پتابایت می‌شود. تخمین‌های دقیق تری نیز برای تعداد منابع رد دیپ وب وجود دارد: تحقیقات او و همکارانش. حدود ۳۰۰۰۰۰ دیپ وب سایت درسال ۲۰۰۴ در کل وب شناسایی شده، و با توجه به شستاکوف، حدود ۱۴۰۰۰ دیپ وب سایت در بخش روسی وب در سال ۲۰۰۶ وجود دارد.
 
== پیدایش اصطلاح دیپ وب ==
== محتوای فهرست‌نشده ==
برگمن در یک مقاله در دیپ وب، یک مجله الکترونیکی انتشاراتی، ذکر کرد که جیل السورث از اصطلاح وب پنهان در سال ۱۹۹۴ استفاده کرد که به وب سایت‌هایی که توسط هیچ موتور جستجویی ثبت نام نشده بودند اشاره می‌کرد. برگمن به مقاله‌ای که توسط فرانک گارسیا در ژانویه سال ۱۹۹۶ نوشته شده بود اشاره کرد:
 
«ممکن است یک سایت به دلایل منطقی ای طراحی شده باشد، ولی آن‌ها زحمت ثبت نام کردن آن در هیچ‌یک از موتورهای جستجو را به خود ندادند؛ بنابراین، هیچ‌کس نمی‌تواند آن‌ها را پیدا کند! شما پنهان هستید. من آن‌ها را وب مخفی می‌نامم.»
 
یکی دیگر از استفاده‌های اولیه از اصطلاح وب مخفی توسط بروس مونت و متئو بی. کل از کتابخانه نرم‌افزار شخصی، در یک توصیف از اولین ابزار شناخته شده دیپ وب در یک مصاحبه مطبوعاتی در دسامبر سال ۱۹۹۶ بود.
خط ۲۱:
 
== انواع محتوا ==
روش‌هایی که از لیست شدن صفحات وب توسط مرور گرهایمرورگرهای سنتی جلوگیری می‌کند ممکن است به عنوان یک یا ببیشتر از موارد زیر طبقه‌بندی شود:
# وب متنی: صفحاتی با محتوای متفاوت برای دسترسی‌های مختلف به متون. (مثل محدوده‌هایی از آدرس‌های آی پی یا نتیجهٔ دنباله‌های قبلی)
# محتوای پویا: صفحات پویا که به عنوان پرسشی به پرس‌وجوهای ارسال شده برگردانده می‌شوند …