نوایندکس

یک متا تگ برای درخواست از ربات های اینترنتی که از فهرست کردن یک صفحه وب استفاده نمی‌کنند

قراردادن مقدار نوایندکس (به انگلیسی: noindex) در متاتگ این درخواست را از ربات‌های خزنه اینترنتی دارد که از فهرست کردن یک صفحه وب اجتناب کنند.[۱][۲] دلایلی که ممکن است بخواهید از این متا تگ استفاده کنید عبارتند از: توصیه به روبات‌ها برای فهرست نکردن پایگاه داده‌های بسیار بزرگ، صفحات وب که بسیار گذرا و موقتی هستند، صفحات وب در حال توسعه، یا چاپگر و نسخه‌های موبایل پسند. البته تفسیر تگ noindex گاهی از یک موتور جستجو به موتور جستجوی دیگر کمی متفاوت است.

نوایندکس سازی کل صفحات ویرایش

<html>
<head>
  <meta name="robots" content="noindex">
  <title>Don't index this page</title>
</head>

مقادیر قابل قبول برای متاتگ robots عبارتند از: "none", "all", "index", "noindex", "nofollow" و "follow". استفاده ترکیبی از این مقادیر نیز ممکن است.[۱] برای مثال:

<meta name="robots" content="noindex, follow">

دستورالعمل‌های محدود به یک ربات خاص ویرایش

دستورالعمل نوایندکس را می‌توان تنها به ربات‌های خاصی با تعیین اسم ربات در مقدار "name" در متاتگ محدود کرد.

به عنوان مثال، برای مسدود کردن ربات گوگل:[۳]

<meta name="googlebot" content="noindex">

یا برای مسدود کردن ربات بینگ:

<meta name="bingbot" content="noindex">

یا برای مسدود کردن ربات بایدو:

<meta name="baiduspider" content="noindex">

فایل robots.txt ویرایش

فایل robots.txt می‌تواند برای جلوگیری از خزیدن ربات‌ها استفاده شود.

نوایندکس کردن بخشی از یک صفحه ویرایش

همچنین ممکن است بخشی از یک صفحه وب، به عنوان مثال متن ناوبری، از نمایه شدن به جای کل صفحه حذف شود. تکنیک‌های مختلفی برای انجام این کار وجود دارد. امکان استفاده از چندین در ترکیب وجود دارد. عنکبوت اصلی نمایه سازی گوگل، Googlebot، هیچ‌یک از این تکنیک‌ها را نمی‌شناسد.

تگ <noindex> ویرایش

موتور جستجوی روسی یاندکس تگ جدید <noindex> را معرفی کرد که از ایندکس محتوای بین تگ‌ها جلوگیری می‌کند. برای معتبر ماندن کد صفحات، می‌توان از <!--noindex--> استفاده کرد.[۴]

<p>
Do index this text.
<noindex>Don't index this text.</noindex>
<!--noindex-->Don't index this text.<!--/noindex-->
</p>

سایر خزنده‌های وب نیز تگ <noindex> را می‌شناسند.[۵]

میکروفرمت ویرایش

مشخصات میکروفرمت‌های پیش نویس ۲۰۰۵ با همین عملکرد وجود دارد. نمایه حذف ربات به دنبال ویژگی و مقدار class="robots-noindex" در تگ‌های HTML می‌گردد:[۶]

<p>Do index this text.</p>
<div class="robots-noindex">Don't index this text.</div>
<span class="robots-noindex">Don't index this text.</span>
<p class="robots-noindex">Don't index this text.</p>

استفاده ترکیبی از مقادیر نیز ممکن است،[۶] برای مثال:

<div class="robots-noindex robots-follow">Text.</div>

یاهو ویرایش

در سال ۲۰۰۷، یاهو! عملکرد مشابه میکروفرمت را به خزنده خود معرفی کرد. با این حال، عنکبوتخزنده یاهو از این نظر ناسازگار است که به دنبال مقدار class="robots-nocontent" و فقط این مقدار می‌گردد:[۷]

<p>Do index this text.</p>
<div class="robots-nocontent">Don't index this text.</div>
<span class="robots-nocontent">Don't index this text.</span>
<p class="robots-nocontent">Don't index this text.</p>

شیرپوینت ویرایش

آی‌فیلتر شیرپوینت ۲۰۱۰ محتوای داخل یک تگ <div> با ویژگی و مقدار class="noindex" را حذف می کند. همچنین مشخص نیست که آیا این ویژگی را می‌توان برای تگ‌هایی غیر از <div> اعمال کرد یا خیر.[۸]

<p>Do index this text.</p>
<div class="noindex">Don't index this text.</div>

نظرات ساختاریافته ویرایش

جستجوگر گوگل از نظرات ساختاریافته استفاده می‌کند:[۹]

<p>
Do index this text.
<!--googleoff: all-->
Don't index this text.
<!--googleon: all-->
</p>

سایر خزنده‌ها از نظرات ساختاریافته خود استفاده می‌کنند.

منابع ویرایش

  1. ۱٫۰ ۱٫۱ Robots and the META element, Official W3 specification
  2. About the Robots <META> tag
  3. Using meta tags to block access to your site, Google Webmasters Tools Help
  4. "Using HTML tags". webmaster → help. Yandex. Section: <noindex> tag. Retrieved March 25, 2013.
  5. "General Search FAQ". Help. Atomz. 2013. Section: How do I exclude parts of my site from being searched?. Archived from the original on 8 December 2021. Retrieved March 23, 2013. Need to prevent parts of individual pages from being searched? If you want to exclude portions of a page from indexing, surround the text with <noindex> and </noindex> tags. This is useful, for example, if you want to exclude navigation text from searches.(نیازمند ثبت‌نام)
  6. ۶٫۰ ۶٫۱ Janes, Peter (June 18, 2005). "Robot Exclusion Profile". Microformats. Retrieved March 24, 2013.
  7. Garg, Priyank (May 2, 2007). "Introducing Robots-Nocontent for Page Sections". Yahoo! Search Blog. Yahoo!. Archived from the original on August 20, 2014. Retrieved March 23, 2013.
  8. "Control Search Indexing (Crawling) Within a Page with Noindex". Microsoft Developer. Microsoft. June 7, 2010. Archived from the original on November 4, 2017. Retrieved November 4, 2017.
  9. "Administering Crawl: Preparing for a Crawl". Google Search Appliance. Google Inc. August 23, 2012. Section: Excluding Unwanted Text from the Index. Archived from the original on November 23, 2012. Retrieved March 23, 2013.