وب معنایی: تفاوت میان نسخهها
محتوای حذفشده محتوای افزودهشده
FreshmanBot (بحث | مشارکتها) |
FreshmanBot (بحث | مشارکتها) جز اصلاح فاصله مجازی + اصلاح نویسه با استفاده از AWB |
||
خط ۴:
این واژه توسط تیم برنرزلی، مخترع وب گسترده جهانی و گرداننده w3c، ابداع شد که هم اکنون بر توسعه استانداردهای مطرح شده وب معنایی نظارت دارد. او وب معنایی را این گونه معنی کرد که «تارنمایی از داده که میتواند مستقیم و غیر مسقیم توسط ماشین مورد پردازش قرار بگیرد.»
درحالی که منتقدان پرسشهایی دربارهٔ امکانپذیر بودن آن دارند، طرفداران استدلال میکنند که برنامههای کاربردی در صنعت، زیستشناسی و تحقیقات علوم انسانی، در حال حاضر، اعتبار مفهوم اصلی را ثابت
== تعریف ==
وب معنایی را میشود فضایی جهانی از جنس محاسبات هوشمند ماشینی تصوّر کرد که در آن تمامی کتابها، کتابخانهها، دانشها، دانشنامهها و
* پروژهای با هدف ایجاد رسانهای جهانی برای رد و بدل کردن اطلاعات به صورتی که برای کامپیوتر قابل فهم و پردازش باشد.
* وب معنایی، شبکهای از اطلاعات در مقیاس جهانی است به نحوی که پردازش
* وب معنایی شامل دادههای هوشمند وب است که توسط ماشینها قابل پردازش است.
هر چند نزدیکی به تحقّقّ ایجاد چنان فضایی محتاج پیشرفتهایی جدید و کلّینگرانه در بسیاری از زمینههای مهندسی، ریاضی، هوش مصنوعی، و به ویژه در زبانشناسی، فلسفه، و بسیاری از معارف دیگر انسانی خواهد بود، گامهای اوّلیّه در این سمت برداشته
== نیاز کنونی دنیای IT به وب معنایی ==
در حقیقت نیاز کنونی دنیای IT را با دو مثال میتوانیم مشخص کنیم مثال اول: شما میتوانید در سایت گوگل لغت شبکه را جستجو کنید جوابی که گوگل به شما میدهد به ترتیب شامل مواردی مثل شبکه هتلهای ایران شرکت خدمات میزبانی سایت، شبکه کارمندان ایرانی کانادایی شبکه مدرسه سازمان بورس اوراق بهادار و … است که در این جستجو از ۵۲۸۰۰۰۰ پاسخ گوگل بیشتر آنها به درد شما نمیخورد از سوی دیگر مواردی که ذکر کردم همگی از جمله مواردی هستند که در صفحه اول پاسخ جستجو دیده میشود. مثال دوم: من به دنبال شرکتی میگردم که خدمات میزبانی سایت ارائه کند پس در گوگل جستجو میکنم خدمات میزبانی سایت و ۳۶۶۰۰۰۰ پاسخ دریافت میکنم که
== تاریخچه ==
مفهوم مدل شبکه معنایی در اوایل دهه شصت توسط دانشمند شناختی Allan M.Collins، زبانشناس M. Ross Quillian و روانشناس Elizabeth F.Loftus در نشریات مختلف به عنوان یک فرم برای نمایش دادن دانش ساخت یافته معنایی، ابداع شد. قراردادن ابردادهٔ قابل خواندن توسط ماشین دربارهٔ صفحات و چگونگی ارتباط آنها با یکدیگر، فعال کردن عاملهای خودکارشده برای دسترسی هوشمندانه تر وب و انجام وظایف از طرف کاربران موجب گسترش یافتن شبکهٔ صفحات وب ابرپیوند شده گردید که پیش از آن تنها توسط انسان قابل خواندن بود.
خیلی از فناوریهایی که توسط w3c مطرح
== هدف ==
اصلیترین هدف وب معنایی قادر ساختن کاربران برای پیداکردن، اشتراک گذاشتن و راحت تر ترکیب کردن اطلاعات جهت تکامل بخشیدن وب حاضر است. انسانها توانایی استفاده از وب را برای پیش بردن وظایفی مانند پیدا کردن معادل ایرلندی کلمه «پوشه»، رزرو کردن یک کتاب از کتابخانه و جستجو برای پایینترین قیمت یک DVD را دارند. به هرحال، ماشینها نمیتوانند تمام این وظایف را بدون دستورالعمل انسان انجام دهند، چرا که صفحات وب طوری طراحی شدهاند که توسط مردم خوانده شود، نه ماشینها. وب معنایی یک چشمانداز از اطلاعات است که میتواند به آسانی توسط ماشین تفسیر شود، بنابرین ماشینها میتوانند بسیاری از کارهای
وب معنایی، همانطور که در ابتدا
تیم برنز لی در ابتدا چشمانداز وب معنایی را این گونه توصیف کرد:
{{quotation | من رؤیایی دارم برای وب که در آن کامپیوترها توانایی تحلیل تمام دادههای روی وب، مثل محتوا، پیوندها و تراکنشهای بین مردم و کامپیوترها را دارند. یک وب معنایی، که این امر را ممکن میسازد، فعلاً در حال ظهور است، اما زمانی که کامل شود، روالهای روزانه تجارت، بروکراسی و زندگی روزمره ما توسط گفتگوی بین ماشینها انجام میشود. عاملهای هوشمند بین مردم برای
وب معنایی به عنوان یک جمعکننده بین تمام محتوی مختلف، سیستمها و برنامههای کاربردی اطلاعاتی در نظر گرفته
معمولاً واژههای معناشناسی، ابرداده،
== محدودیتهای HTML ==
بسیاری از فایلهای روی یک کامپیوتر معمولی را میتوان آزادانه به اسناد قابل خواندن توسط انسان و دادههای قابل خواندن برای ماشین تقسیم کرد. اسناد مثل پیام نامهها، گزارشات و بروشورها توسط انسان خوانده میشود. داده، مثل تقویم، دفترچه آدرس، لیست پخش و صفحات گسترده از یک برنامه کاربردی برای نمایش، جستجو و ترکیب در حالات مختلف استفاده میکنند.
در حال حاضر، تارنمای گسترده جهانی عمدتاً بر مبنای اسنادی است که با HTML نوشته شده است، یک استاندارد
<source lang="html4strict">
خط ۴۳:
</source>
با HTML و ابزاری برای نمایش خروجی آن (مثل مرورگرهای وب) هرکسی میتواند
HTML معنایی اشاره به عمل HTML سنتی در قصد نشانه گذاریها دارد به جای این که مستقیماً جزئیات چینش را مشخص کند. برای مثال کاربرد <code><nowiki><em></nowiki></code> برای نشان دادن «تاکید» است، بیشتر از <code><nowiki><i></nowiki></code> که ایتالیک شدن را مشخص میکند. جزئیات چینش در ترکیب با CSSها در سمت مرورگر است. اما این عمل برای مشخص کردن معانی عناصر مثل موارد فروش و قیمت ناکارآمد است.
Microformatها تلاشهای غیررسمی گسترش تگهای HTML را برای ایجاد
== راهکارهای وب معنایی ==
وب معنایی راه کارهای اضافه تری دارد که شامل نشر زبانهایی که مختص داده طراحی شدهاند، مثل چهارچوب شرح منابع(RDF)، زبان
این فناوریها به منظور فراهم آوردن شرحی که محتوی اسناد وب را تکمیل یا جایگزین کند، ترکیب شدهاند. بنابرین، محتوی ممکن است به عنوان دادههای توصیفی ذخیره شده در پایگاه دادههای قابل دسترس وب، یا
یک مثال از یک تگ که میتواند در یک صفحه وب غیر معنایی استفاده شود:
خط ۸۰:
=== ابر-ویکی ===
سایتهای از نوع ویکی روبه رشدند. مدیران
== چالشها ==
برخی از چالشهای وب معنایی شامل وسعت، ابهام، تردید، تناقض و فریب. سیستمهای
* وسعت: تارنمای گسترده جهانی شامل میلیاردها صفحه
* ابهام: وجوه مبهمی مانند «جوان» و «بلند» وجود دارد. این ناشی میشود از ابهام درخواست کاربران، از وجوه ارائه شده توسط گردآورندگان محتوی، از انطباق واژههای درخواست با واژههای گرداورندگان و از تلاش برای ترکیب مبانی دانشهای مختلف با وجوه مشترک ولی جنبههای متفاوت. منطق فازی رایجترین تکنیک برای مقابله با ابهام است.
* عدم قطعیت: وجوه دقیقی با ارزشهای مشکوک وجود دارد. برای مثال، یک بیمار ممکن است
* تناقض: تناقضات منطقی ای وجود دارد که به ناچار در طول توسعه
* فریب: زمانی رخ میدهد که
این لیست چالشها بیش از این که کامل باشد، روشنگر است و روی چالشهای لایههای «منطق وحدت» و «برهان» از وب معنایی، تمرکز دارد. گزارش آخر گروه رشد برای استدلال عدم قطعیت W3C، تمام این مشکلات را تحت عنوان «عدم قطعیت» جمع کرد. خیلی از تکنیکهای ذکر شده در اینجا الحاقاتی نیاز خواهند داشت به زبان
== استانداردها ==
خط ۹۶:
=== اجزا ===
واژه «وب معنایی» معمولاً استفاده میشود برای اشاره به فرمتها و فناوریهایی که
* چارچوب تشریح منابع (RDF) یک روش عمومی برای توصیف اطلاعات
* شمای RDF (RDFS)
خط ۱۰۴:
* N-Triples، فرمتی برای ذخیره کردن و انتقال داده
* لاکپشت[سه تایی] (زبان RDF سه مختصر و مفید)
* زبان
پشته وب معنایی روشنگر معماری وب معنایی است. توابع و روابط اجزا میتواند به صورت زیر خلاصه شود:
* XML یک گرامر عنصری برای ساختار محتوی داخل اسناد فراهم میآورد.XML در حال حاضر یکی از اجزا لازم فناوریهای وب معنایی در خیلی از موارد نیست، به عنوان جایگزین گرانرهای موجود، از قبیل لاکپشت. لاکپشت یک استاندارد بالفعل است اما از طریق یک فرایند استاندارد رسمی نبوده است.
* شمای XML یک زبان برای فراهم آوردن و محدود کردن ساختار و محتوی عناصری است که در اسناد XML وجود دارند.
* RDF یک زبان ساده برای توصیف مدلهای داده است که به اشیا ("منابع") و روابطشان اشاره دارد. یک مدل برپایه RDFمیتواند در گرامرهای مختلفی ارائه شود، مثل RDF/XML,N3، لاکپشت و RDFa. RDF یک استاندارد
* شما RDF, RDF را توسعه داده است و یک لغت برای توصیف ویژگیها و کلاسهای منابع بر پایه RDF، با معانی برای تعمیم سلسله مراتب از خواص و طبقات است.
* OWL لغات بیشتری برای توصیف ویژگیها و کلاسها اضافه میکند: از بین آنها، روابط بین کلاس ها(disjointness), cardinality(برای مثال "دقیقاً یک")، برابری،
* SPARQL یک پروتکل و زبان کوئری از مبانع وب معنایی است.
=== وضعیت فعلی
استاندارد سازیهای در حال پیشرفت فعلی شامل:
* قانون فرمت تبادل(RIF) به عنوان
لایههایی کههایی که هنوز
* لایههای منطق وحدت و مدرک تحت تحقیقات فعال هستند.
مقصود بالابردن قابلیت استفاده و فایده وب است و ارتباط تنگاتنگ آن با منابع از طریق:
* سرورهایی سیستمهای
* اسناد «نشانه گداری شده» با اطلاعات معنایی (یک توسعه از تگ <meta>در HTML در صفحات وب امروزی برای تأمین اطلاعات موتورهای جستجوی وب، با استفاده از وب خزنده، به کاربرده میشود). این میتواند اطلاعات قابل فهم برای ماشین دربارهٔ محتوی اسناد قابل فهم برای انسان باشد (از قبیل تولیدکننده، عنوان، توضیحات اسناد) یا میتواند صرفاً ابرداده نمایش دهنده
* واژگان ابرداده رایج (هستی شناسیها) و نگاشت بین واژگان که به خالقان اسناد اجازه میدهد بدانند که چگونه اسنادشان را
* عاملهای خودکارشده برای اجرای وظایف برای کاربران وب معنایی با استفاده از این داده
* خدمات برپایه وب (معمولاً با عاملهای خودشان) برای تأمین اطلاعات مخصوص
== واکنشهای شکاک ==
=== امکانسنجی عملی ===
منتقدان شدنی بودن تحقق کامل یا جزئی وب معنایی را میپرسند. بحران Cory Doctorow ("ابرچرند") از دورنمای رفتار انسان و ارجحییات شخصی هست. برای مثال، مردم ممکن است برای گمراه کردن موتورهای وب معنایی که فرض را بر صحت ابرداده میگذارند، ابرداده جعلی به صفحات وب وارد کنند. این پدیده در ابرتگها شناخته شده بود که الگوریتم رتبهبندی آلتاویستا را با بالابردن رتبه صفحات وب بخصوص فریب میداد: موتور
جایی که فناوریهای وب معنایی درجه پذیرش عملی بالاتری پیدا کرد، تمایل بیشتری به بودن آن در هسته جوامع تخصصی و سازمانهای برای پروژههای درون سازمانی است. محدودیتها به سوی پذیرش عملی، در دامنهها و حوزههای محدود تر از چالش کمتری نسبت به عامه مردم و تارنمای گسترده جهانی دارد.
== پتانسیل یک ایده در حال پیشرفت سریع ==
مقاله ابتکاری Scientific American در سال ۲۰۰۱ توسط برنزلی تکامل مورد انتظار از وب موجود به وب معنایی را توصیف کرد. یک تکامل کامل چنانکه توسط برنزلی توصیف شد فعلاً در حال اتفاق افتادن است. در ۲۰۰۶ برنزلی و همکارانش اظهار داشتند که: "این ایده ساده، به هر حال، تا حد زیادی تحقق نیافته
== سانسور و حفظ حریم خصوصی ==
اشتیاق دربارهٔ وب معنایی میتواند با نگرانیها درمورد سانسور و حفظ حریم خصوصی تعدیل شود. برای مثال، فناوریهای تحلیل متن حالا میتوانند با استفاده از کلمات دیگر به راحتی کنار گذاشته شود، مثلاً استعارهها، یا با استفاده از تصاویر به جای متن. یک اجرا
== دوبرابر شدن فرمتهای خروجی ==
انتقاد دیگر به وب معنایی این است که زمان بیشتری صرف ساخت و انتشار محتوی میشود، چرا که برای یک تکه از داده به دو فرمت نیاز است: یکی برای نمایش انسان و یکی برای ماشینها. به هرحال، بسیاری از برنامههای کاربردی در حال توسعه وب، در حال پرداختن به این موضوع از طریق ایجاد یک فرمت قابل خواندن برای ماشین پس از انتشار داده یا درخواست ماشین برای پنین داده هستند. توسعه microformatها واکنشی دیگر به این نوع از انتقاد است. یکی دیگر از استدلالها در دفاع از امکانسنجی وب معنایی، احتمالاً قیمت در حال سقوط وظایف هوش انسانی در بازار کار دیجیتال، مثلAmazon Mechanical Turk است.
مشخصات از قبیل eRDF و RDFa، به دادههای دلخواه RDF اجازه میدهد در صفحات HTML تعبیه بشوند. مکانیزم GRDDL (گردآوری توصیفات منابع از روی گویشهای زبانی) به ماده موجود (شامل ریزقالبها یا Micro-formats) اجازه میدهد
== پروژهها ==
خط ۱۴۹:
=== DBpedia ===
DBpedia یک تلاش برای برای انتشار داده
=== FOAF ===
خط ۱۵۷:
=== SIOC ===
پروژه جوامع آنلاین معنایی پیوسته (SIOC، «شاک» تلفظ میشود) یک واژگان از اصطلاحات و روابط را که فضاهای داده وب را مدل میکند، فراهم میآورد. مثالهایی از این نوع فضاهای داده شامل: تالارهای گفتگو، بلاگها، پستهای بلاگ/خبرخوانها، لیستهای پستی، به
=== NextBIO ===
یک پایگاه داده
== جستارهای وابسته ==
|