دی‌بی‌پدیا: تفاوت میان نسخه‌ها

محتوای حذف‌شده محتوای افزوده‌شده
صفحه‌ای تازه حاوی «'''دی بی پدیا''' (از "دی بی" برای "پایگاه داده") یک پروژه با هدف استخراج محتوای س...» ایجاد کرد
برچسب‌ها: افزودن پیوند بیرونی به جای ویکی‌پیوند ویرایشگر دیداری
 
خط ۱:
'''دی بی پدیا''' (از "دی بی" برای "[[پایگاه داده]]") یک پروژه با هدف استخراج محتوای ساختاری از اطلاعات ایجاد شده در پروژه ویکی پدیاویکی‌پدیا است. این اطلاعات ساختاری بر روی وب جهانی در دسترس است.{{Infobox software|name=دی بی پدیا|logo=DBpediaLogo.svg|logo size=200px|screenshot=|caption=|developer={{plainlist|
* [[دانشگاه لایپزیگ]]
* [[دانشگاه]] [[مانهایم]]
* [[نرمنرم‌افزار افزار لینک هایلینک‌های باز]]
}}|released={{start date and age|df=yes|paren=yes|2007|01|10}}|latest_release_version=دی بی پدیا 2016-10|latest_release_date=July 4, 2017|operating_system=سرور جهانی|genre=|programming language={{flatlist|
* [[اسکالا]]
خط ۱۰:
 
== توضیحات ==
دی بی پدیا به کاربران اجازه می دهدمی‌دهد تا به صورت معنا شناختی روابط و خواص منابع ویکی پدیاویکی‌پدیا را جستجو کنند، از جمله پیوندهایی به مجموعه داده هایداده‌های مرتبط. تیم برنرز-لی دی بی پدیا را به عنوان یکی از معروفترین بخش هایبخش‌های متمرکز در ارتباط با داده هایداده‌های متمرکز توضیح داده استداده‌است.
 
== زمینه ==
این پروژه توسط افرادی در [[دانشگاه فرای برلین|دانشگاه آزاد برلین]] و [[دانشگاه لایپزیگ]] با همکاری [[نرم‌افزار|نرم افزار]] لینک هایلینک‌های باز آغاز شد.شد؛ و اولین مجموعه داده در دسترس عموم در سال 2007۲۰۰۷ منتشر شد. تحت مجوزهای آزاد (CC-BY-SA) در دسترس است، به دیگران اجازه داده می شودمی‌شود تا مجموعه داده هاداده‌ها را دوباره استفاده کنند؛ با این وجود، از مجوز داده باز استفاده نمی کندنمی‌کند تا حقوق پایگاه داده سوئی را لغو کند.
 
مقالات ویکیپدیاویکی‌پدیا عمدتاعمدتاً شامل متن آزاد هستند، اما شامل اطلاعات ساختاری شده در مقالاتی همچون جداول «جعبه اطلاعات» (پانل هایپانل‌های کشویی که در بالا سمت راست نمای پیش فرض بسیاری از مقالات ویکی پدیاویکی‌پدیا یا در ابتدا نسخه هاینسخه‌های تلفن همراه)، اطلاعات طبقه بندی،طبقه‌بندی، تصاویر، مختصات جغرافیایی و لینک هالینک‌ها به صفحات وب خارجی. این اطلاعات ساختاری استخراج و قرار داده شده در یک مجموعه داده یکسان است که می تواندمی‌تواند مورد پرسش قرار گیرد.
 
== مجموعه داده ==
مجموعه داده دی بی پدیا توضیح داده شده استشده‌است. 4.58۴٫۵۸ میلیون نهاد، از جمله 4.22۴٫۲۲ میلیون نفر در هستی شناسی پایدار، از جمله 1،445،000۱٬۴۴۵٬۰۰۰ نفر، 735،000۷۳۵٬۰۰۰ مکان، 123،000۱۲۳٬۰۰۰ آلبوم موسیقی، 87،000۸۷٬۰۰۰ فیلم، 19،000۱۹٬۰۰۰ بازی ویدیویی، 241،000۲۴۱٬۰۰۰ سازمان، 251،000۲۵۱٬۰۰۰ گونه و 6،000۶٬۰۰۰ بیماری، طبقهطبقه‌بندی بندی شده اندشده‌اند. مجموعه داده هاداده‌ها دارای برچسب هابرچسب‌ها و خلاصه ای از این اشخاص تا 125۱۲۵ زبان می باشدمی‌باشد. 25.2۲۵٫۲ میلیون لینک به تصاویر و 29.8۲۹٫۸ میلیون لینک به صفحات وب خارجی. علاوه بر این، حاوی حدود 50۵۰ میلیون لینک به سایر مجموعه داده هایداده‌های RDF) ، 80.9۸۰٫۹) میلیون لینک به دستهدسته‌های های ویکیپدیاویکی‌پدیا و 41.2۴۱٫۲ میلیون دسته (YAGO2) است. دی بی پدیا از چارچوب توصیف منابع (RDF) برای نشان دادن اطلاعات استخراج شده و از سه میلیارد (RDF) سه برابر استفاده می کند،می‌کند، که 580۵۸۰ میلیون از نسخه انگلیسی ویکی پدیاویکی‌پدیا و 2.46۲٫۴۶ میلیارد از دیگر زبان هازبان‌ها استخراج شده استشده‌است.
 
از این مجموعه داده، اطلاعاتی که در سراسر چندین صفحه پخش میمی‌شود، شود، می تواندمی‌تواند استخراج شود، مثلامثلاً نویسنده ینویسندهٔ کتاب می تواندمی‌تواند از صفحات مربوط به کار یا نویسنده ایجاد شود.
 
یکی از چالش هایچالش‌های استخراج اطلاعات از ویکیپدیاویکی‌پدیا این است که مفاهیم مشابه را می توانمی‌توان با استفاده از پارامترهای مختلف در کادر اطلاعات و سایر قالب ها،قالب‌ها، مانند | زادگاه = و | محل تولد = بیان کرد. به این ترتیب، پرس و جو در مورد اینکه در آن مردم متولد شدند، باید هر دو این خواص را جستجو کنند تا نتایج کاملتری کسب کنند. در نتیجه، زبان نقشه بردارینقشه‌برداری دی بی پدیا برای کمک به نقشه بردارینقشه‌برداری این خواص به هستی شناسایی در حالی که کاهش تعداد مترادف هامترادف‌ها توسعه یافته استیافته‌است. با توجه به تنوع زیادی اطلاعات جعبه و خواص در استفاده در ویکی پدیا،ویکی‌پدیا، روند توسعه و بهبود این نقشه هانقشه‌ها به کمک هایکمک‌های عمومی باز شده استشده‌است.
 
نسخه 2014۲۰۱۴ در سپتامبر 2014۲۰۱۴ منتشر شد. یک تغییر اصلی از نسخه هاینسخه‌های قبلی بود که متون انتزاعی استخراج شد. به طوربه‌طور خاص، اجرای یک آینه محلی از ویکیپدیاویکی‌پدیا و بازیابی خلاصه هایخلاصه‌های ارائه شده از آن، متون را به طوربه‌طور قابل توجهی پاک تر کرده استکرده‌است. همچنین یک مجموعه داده جدید استخراج شده از ویکیپدیاویکی‌پدیا معرفی شد.
 
== مثال هامثال‌ها ==
دی بی پدیا اطلاعات واقعی را از صفحات ویکی پدیاویکی‌پدیا استخراج می کند،می‌کند، به کاربران اجازه می دهدمی‌دهد تا پاسخ هایپاسخ‌های سوالاتی را که در سراسر مقالات متعدد ویکی پدیاویکی‌پدیا منتشر می شوندمی‌شوند پیدا کنند. داده هاداده‌ها با استفاده از یک زبان پرس و جو مانند (SQL) برای (RDF) به نام (SPARQL) قابل دسترسی هستند. به عنوان مثال، تصور کنید که شما علاقه مندعلاقه‌مند به سری ژاپنی (shōjo manga Tokyo Mew Mew) هستید و می خواهیدمی‌خواهید ژانرهای دیگر کارهای نوشته شده توسط تصویرگر خود را پیدا کنید. دی بی پدیا اطلاعاتی از نوشتهنوشته‌های های ویکیپدیاویکی‌پدیا را در توکیو میو میو در آثاری مانند سوپر عروسک لیساچان و هر کوپید دارد. از آنجا که دی بی پدیا اطلاعات را به یک پایگاه داده ساده تبدیل می کند،می‌کند، پرس و جو زیر می تواندمی‌تواند بدون نیاز به دانستن دقیقادقیقاً کدام ورود هر قطعه اطلاعات را پر کند و ژانرهای مرتبط را لیست کند.
 
== از موارد استفاده کنید ==
دی بی پدیا دامنه گسترده ایگسترده‌ای از اشخاص را پوشش می دهدمی‌دهد که زمینه هایزمینه‌های مختلف دانش انسانی است. این باعث می شودمی‌شود که یک مرکز طبیعی برای اتصال مجموعه داده هاداده‌ها باشد، در حالی که مجموعه داده هایداده‌های خارجی می تواندمی‌تواند به مفاهیم آن پیوند دهد. مجموعه داده دی بی پدیا در سطح (RDF) با دیگر مجموعه داده هایداده‌های باز در وب ارتباط برقرار می کندمی‌کند. این برنامه را قادر میمی‌سازد سازد داده هایداده‌های دی بی پدیا را با داده هایداده‌های این مجموعه داده هاداده‌ها غنی سازی کند. در سپتامبر 2013۲۰۱۳ بیش از 45۴۵ میلیون لینک بین دی بی پدیا و مجموعه داده هایداده‌های خارجی وجود دارد از جمله [[فری‌بیس|فری بیس]]OpenCyc)،, UMBEL،UMBEL, GeoNames،GeoNames, MusicBrainz،MusicBrainz, CIA World Fact Book،Book, DBLP)، پروژه گوتنبرگ، (DBtune Jamendo،Jamendo, Eurostat،Eurostat, UniProt،UniProt, Bio2RDF و US) داده هایداده‌های سرشماری طرح ابتکاری [[تامسون رویترز]] کالاهای باز، پروژه اطلاعات مرتبط با داده باز شده استشده‌است از نیویورک تایمز، ((API Zemanta)(Spotlight دی بی پدیا نیز شامل پیوندهایی به دی بی پدیا است. [[بی‌بی‌سی|بی بی سی]] ازدی بی پدیا برای کمک به سازماندهی محتوای آن استفاده می کندمی‌کند. فاویکی با استفاده از دی بی پدیا برای برچسب زدن معنایی همچنین سامسونگ دی بی پدیا را در "«پلتفرم اشتراک دانش"» خود قرار می دهدمی‌دهد.
 
چنین منبع غنی از دانش متقاطع ساختار یافته، زمینه ای مناسب برای سیستم هایسیستم‌های هوش مصنوعی است. دی بی پدیا به عنوان یکی از منابع دانش در [[آی‌بی‌ام|آی بی ام]] واتسون جاسوسی مورد استفاده قرار گرفت! سیستم برنده
 
آمازون یک مجموعه اطلاعات دی بی پدیا را فراهم می کندمی‌کند که می تواندمی‌تواند در برنامه هایبرنامه‌های وب سرویس هایسرویس‌های آمازون ادغام شود.
 
== نورافکن دی بی پدیا ==
نورافکن دی بی پدیا یک ابزار برای اعلان اشاره به منابع دی بی پدیا در متن است. این اجازه می دهدمی‌دهد که منابع اطلاعاتی بدون ساختار را از طریق دی بی پدیا به [[ابر داده]] ابر مرتبط کند. نورافکن دی بی پدیا استخراج نام موسسهمؤسسه نامیده می شود،می‌شود، از جمله شناسایی نهاد و وضوح نام (به بیان دیگر، ابهام). همچنین می تواندمی‌تواند برای شناسایی نام شرکت و سایر اطلاعات استخراج اطلاعات مورد استفاده قرار گیرد. هدف نورافکن دی بی پدیا برای قابل تنظیم برای بسیاری از موارد استفاده است. به جای تمرکز بر چند نوع نهاد، این پروژه تلاش می کندمی‌کند از حاشیه نویسی تمام 3.5۳٫۵ میلیون نهادها و مفاهیم از بیش از 320۳۲۰ کلاس در دی بی پدی حمایت کند. این پروژه در ژوئن 2010۲۰۱۰ در گروه سیستم هایسیستم‌های مبتنی بر وب در دانشگاه آزاد برلین آغاز شد.
 
نورافکن دی بی به عنوان یک سرویس وب برای آزمایش و یک (API) جاوا / مقیاس API مجوز از طریق پروانه آپاچی به صورت عمومی در دسترس است. توزیع نورافکن دی بی پدیا شامل یک پلاگین جی کوئری است که به توسعه دهندگان اجازه می دهدمی‌دهد صفحات را در هر نقطه از صفحات وب با اضافه کردن یک خط به صفحه خود اضافه کنند. مشتریان نیز در جاوا یا پی اچ پی در دسترس هستند. این ابزار از طریق صفحه آزمایشی و خدمات وب به زبان هایزبان‌های مختلفی مدیریت می کندمی‌کند. بین المللیبین‌المللی بودن برای هر زبان ای که نسخه ویکی پدیاویکی‌پدیا دارد، پشتیبانی می شودمی‌شود.
 
== جستارهای وابسته ==
== همچنین نگاه کنید ==
* [[بابلنت]]
* [[ویکی واژگان معنایی]]