وب پنهان: تفاوت میان نسخهها
محتوای حذفشده محتوای افزودهشده
FreshmanBot (بحث | مشارکتها) جز اصلاح فاصله مجازی + اصلاح نویسه با استفاده از AWB |
بدون خلاصۀ ویرایش |
||
خط ۷:
در سال ۲۰۰۰، مایکل کی. برگمن گفت چگونه سرچ کردن در اینترنت را میتوان با کشیدن یک شبکه در میان سطح یک اقیانوس مقایسه کرد: ممکن است که یک معامله خوبی در شبکه بدست بیاید، اما ثروتی از اطلاعات وجود دارد که عمیق و در نتیجه از دست رفتهاست. بسیاری از اطلاعات وب بسیار پایین در سایتها دفن شدهاند، و موتورهای جست و جوی استاندارد آنها را پیدا نمیکنند. موتورهای جستجوی سنتی محتوای در دیپ وب را نمیتوانند ببینند یا بازیابی کنند. بخشی از وب که توسط موتورهای جستجوی لیست شده به عنوان سرفیس وب (وب سطحی) شناخته میشود. در سال ۲۰۰۱، دیپ وب چندین برابر بزرگتر از سرفیس وب بود. یک مقایسه از کوه یخ توسط دنیس شستاکوف به ترتیب نشان دهندهٔ تفاوت بین سرفیس وب و دیپ وب است:
براوردهای مبتنی بر تعمیم دهی از یک مطالعه انجام شده در دانشگاه کالیفرنیا برکلی در سال ۲۰۰۱ اندیشید که دیپ وب حدوداً شامل ۷٫۵ پتابایت میشود. تخمینهای دقیق تری نیز برای تعداد منابع رد دیپ وب وجود دارد: تحقیقات او و همکارانش. حدود ۳۰۰۰۰۰ دیپ وب سایت درسال ۲۰۰۴ در کل وب شناسایی شده، و با توجه به شستاکوف، حدود ۱۴۰۰۰ دیپ وب سایت در بخش روسی وب در سال ۲۰۰۶ وجود دارد.
== پیدایش اصطلاح دیپ وب ==
برگمن در یک مقاله در دیپ وب، یک مجله الکترونیکی انتشاراتی، ذکر کرد که جیل السورث از اصطلاح وب پنهان در سال ۱۹۹۴ استفاده کرد که به وب سایتهایی که توسط هیچ موتور جستجویی ثبت نام نشده بودند اشاره میکرد. برگمن به مقالهای که توسط فرانک گارسیا در ژانویه سال ۱۹۹۶ نوشته شده بود اشاره کرد:
«ممکن است یک سایت به دلایل منطقی ای طراحی شده باشد، ولی آنها زحمت ثبت نام کردن آن در هیچیک از موتورهای جستجو را به خود ندادند؛ بنابراین، هیچکس نمیتواند آنها را پیدا کند! شما پنهان هستید. من آنها را وب مخفی مینامم.»
یکی دیگر از استفادههای اولیه از اصطلاح وب مخفی توسط بروس مونت و متئو بی. کل از کتابخانه نرمافزار شخصی، در یک توصیف از اولین ابزار شناخته شده دیپ وب در یک مصاحبه مطبوعاتی در دسامبر سال ۱۹۹۶ بود.
خط ۲۱:
== انواع محتوا ==
روشهایی که از لیست شدن صفحات وب توسط
# وب متنی: صفحاتی با محتوای متفاوت برای دسترسیهای مختلف به متون. (مثل محدودههایی از آدرسهای آی پی یا نتیجهٔ دنبالههای قبلی)
# محتوای پویا: صفحات پویا که به عنوان پرسشی به پرسوجوهای ارسال شده برگردانده میشوند …
|