'''دی بی پدیا''' (از "دی بی" برای "[[پایگاه داده]]") یک پروژه با هدف استخراج محتوای ساختاری از اطلاعات ایجاد شده در پروژه ویکی پدیاویکیپدیا است. این اطلاعات ساختاری بر روی وب جهانی در دسترس است.{{Infobox software|name=دی بی پدیا|logo=DBpediaLogo.svg|logo size=200px|screenshot=|caption=|developer={{plainlist|
* [[دانشگاه لایپزیگ]]
* [[دانشگاه]] [[مانهایم]]
* [[نرمنرمافزار افزار لینک هایلینکهای باز]]
}}|released={{start date and age|df=yes|paren=yes|2007|01|10}}|latest_release_version=دی بی پدیا 2016-10|latest_release_date=July 4, 2017|operating_system=سرور جهانی|genre=|programming language={{flatlist|
* [[اسکالا]]
== توضیحات ==
دی بی پدیا به کاربران اجازه می دهدمیدهد تا به صورت معنا شناختی روابط و خواص منابع ویکی پدیاویکیپدیا را جستجو کنند، از جمله پیوندهایی به مجموعه داده هایدادههای مرتبط. تیم برنرز-لی دی بی پدیا را به عنوان یکی از معروفترین بخش هایبخشهای متمرکز در ارتباط با داده هایدادههای متمرکز توضیح داده استدادهاست.
== زمینه ==
این پروژه توسط افرادی در [[دانشگاه فرای برلین|دانشگاه آزاد برلین]] و [[دانشگاه لایپزیگ]] با همکاری [[نرمافزار|نرم افزار]] لینک هایلینکهای باز آغاز شد.شد؛ و اولین مجموعه داده در دسترس عموم در سال 2007۲۰۰۷ منتشر شد. تحت مجوزهای آزاد (CC-BY-SA) در دسترس است، به دیگران اجازه داده می شودمیشود تا مجموعه داده هادادهها را دوباره استفاده کنند؛ با این وجود، از مجوز داده باز استفاده نمی کندنمیکند تا حقوق پایگاه داده سوئی را لغو کند.
مقالات ویکیپدیاویکیپدیا عمدتاعمدتاً شامل متن آزاد هستند، اما شامل اطلاعات ساختاری شده در مقالاتی همچون جداول «جعبه اطلاعات» (پانل هایپانلهای کشویی که در بالا سمت راست نمای پیش فرض بسیاری از مقالات ویکی پدیاویکیپدیا یا در ابتدا نسخه هاینسخههای تلفن همراه)، اطلاعات طبقه بندی،طبقهبندی، تصاویر، مختصات جغرافیایی و لینک هالینکها به صفحات وب خارجی. این اطلاعات ساختاری استخراج و قرار داده شده در یک مجموعه داده یکسان است که می تواندمیتواند مورد پرسش قرار گیرد.
== مجموعه داده ==
مجموعه داده دی بی پدیا توضیح داده شده استشدهاست. 4.58۴٫۵۸ میلیون نهاد، از جمله 4.22۴٫۲۲ میلیون نفر در هستی شناسی پایدار، از جمله 1،445،000۱٬۴۴۵٬۰۰۰ نفر، 735،000۷۳۵٬۰۰۰ مکان، 123،000۱۲۳٬۰۰۰ آلبوم موسیقی، 87،000۸۷٬۰۰۰ فیلم، 19،000۱۹٬۰۰۰ بازی ویدیویی، 241،000۲۴۱٬۰۰۰ سازمان، 251،000۲۵۱٬۰۰۰ گونه و 6،000۶٬۰۰۰ بیماری، طبقهطبقهبندی بندی شده اندشدهاند. مجموعه داده هادادهها دارای برچسب هابرچسبها و خلاصه ای از این اشخاص تا 125۱۲۵ زبان می باشدمیباشد. 25.2۲۵٫۲ میلیون لینک به تصاویر و 29.8۲۹٫۸ میلیون لینک به صفحات وب خارجی. علاوه بر این، حاوی حدود 50۵۰ میلیون لینک به سایر مجموعه داده هایدادههای RDF) ، 80.9۸۰٫۹) میلیون لینک به دستهدستههای های ویکیپدیاویکیپدیا و 41.2۴۱٫۲ میلیون دسته (YAGO2) است. دی بی پدیا از چارچوب توصیف منابع (RDF) برای نشان دادن اطلاعات استخراج شده و از سه میلیارد (RDF) سه برابر استفاده می کند،میکند، که 580۵۸۰ میلیون از نسخه انگلیسی ویکی پدیاویکیپدیا و 2.46۲٫۴۶ میلیارد از دیگر زبان هازبانها استخراج شده استشدهاست.
از این مجموعه داده، اطلاعاتی که در سراسر چندین صفحه پخش میمیشود، شود، می تواندمیتواند استخراج شود، مثلامثلاً نویسنده ینویسندهٔ کتاب می تواندمیتواند از صفحات مربوط به کار یا نویسنده ایجاد شود.
یکی از چالش هایچالشهای استخراج اطلاعات از ویکیپدیاویکیپدیا این است که مفاهیم مشابه را می توانمیتوان با استفاده از پارامترهای مختلف در کادر اطلاعات و سایر قالب ها،قالبها، مانند | زادگاه = و | محل تولد = بیان کرد. به این ترتیب، پرس و جو در مورد اینکه در آن مردم متولد شدند، باید هر دو این خواص را جستجو کنند تا نتایج کاملتری کسب کنند. در نتیجه، زبان نقشه بردارینقشهبرداری دی بی پدیا برای کمک به نقشه بردارینقشهبرداری این خواص به هستی شناسایی در حالی که کاهش تعداد مترادف هامترادفها توسعه یافته استیافتهاست. با توجه به تنوع زیادی اطلاعات جعبه و خواص در استفاده در ویکی پدیا،ویکیپدیا، روند توسعه و بهبود این نقشه هانقشهها به کمک هایکمکهای عمومی باز شده استشدهاست.
نسخه 2014۲۰۱۴ در سپتامبر 2014۲۰۱۴ منتشر شد. یک تغییر اصلی از نسخه هاینسخههای قبلی بود که متون انتزاعی استخراج شد. به طوربهطور خاص، اجرای یک آینه محلی از ویکیپدیاویکیپدیا و بازیابی خلاصه هایخلاصههای ارائه شده از آن، متون را به طوربهطور قابل توجهی پاک تر کرده استکردهاست. همچنین یک مجموعه داده جدید استخراج شده از ویکیپدیاویکیپدیا معرفی شد.
== مثال هامثالها ==
دی بی پدیا اطلاعات واقعی را از صفحات ویکی پدیاویکیپدیا استخراج می کند،میکند، به کاربران اجازه می دهدمیدهد تا پاسخ هایپاسخهای سوالاتی را که در سراسر مقالات متعدد ویکی پدیاویکیپدیا منتشر می شوندمیشوند پیدا کنند. داده هادادهها با استفاده از یک زبان پرس و جو مانند (SQL) برای (RDF) به نام (SPARQL) قابل دسترسی هستند. به عنوان مثال، تصور کنید که شما علاقه مندعلاقهمند به سری ژاپنی (shōjo manga Tokyo Mew Mew) هستید و می خواهیدمیخواهید ژانرهای دیگر کارهای نوشته شده توسط تصویرگر خود را پیدا کنید. دی بی پدیا اطلاعاتی از نوشتهنوشتههای های ویکیپدیاویکیپدیا را در توکیو میو میو در آثاری مانند سوپر عروسک لیساچان و هر کوپید دارد. از آنجا که دی بی پدیا اطلاعات را به یک پایگاه داده ساده تبدیل می کند،میکند، پرس و جو زیر می تواندمیتواند بدون نیاز به دانستن دقیقادقیقاً کدام ورود هر قطعه اطلاعات را پر کند و ژانرهای مرتبط را لیست کند.
== از موارد استفاده کنید ==
دی بی پدیا دامنه گسترده ایگستردهای از اشخاص را پوشش می دهدمیدهد که زمینه هایزمینههای مختلف دانش انسانی است. این باعث می شودمیشود که یک مرکز طبیعی برای اتصال مجموعه داده هادادهها باشد، در حالی که مجموعه داده هایدادههای خارجی می تواندمیتواند به مفاهیم آن پیوند دهد. مجموعه داده دی بی پدیا در سطح (RDF) با دیگر مجموعه داده هایدادههای باز در وب ارتباط برقرار می کندمیکند. این برنامه را قادر میمیسازد سازد داده هایدادههای دی بی پدیا را با داده هایدادههای این مجموعه داده هادادهها غنی سازی کند. در سپتامبر 2013۲۰۱۳ بیش از 45۴۵ میلیون لینک بین دی بی پدیا و مجموعه داده هایدادههای خارجی وجود دارد از جمله [[فریبیس|فری بیس]]OpenCyc)،, UMBEL،UMBEL, GeoNames،GeoNames, MusicBrainz،MusicBrainz, CIA World Fact Book،Book, DBLP)، پروژه گوتنبرگ، (DBtune Jamendo،Jamendo, Eurostat،Eurostat, UniProt،UniProt, Bio2RDF و US) داده هایدادههای سرشماری طرح ابتکاری [[تامسون رویترز]] کالاهای باز، پروژه اطلاعات مرتبط با داده باز شده استشدهاست از نیویورک تایمز، ((API Zemanta)(Spotlight دی بی پدیا نیز شامل پیوندهایی به دی بی پدیا است. [[بیبیسی|بی بی سی]] ازدی بی پدیا برای کمک به سازماندهی محتوای آن استفاده می کندمیکند. فاویکی با استفاده از دی بی پدیا برای برچسب زدن معنایی همچنین سامسونگ دی بی پدیا را در "«پلتفرم اشتراک دانش"» خود قرار می دهدمیدهد.
چنین منبع غنی از دانش متقاطع ساختار یافته، زمینه ای مناسب برای سیستم هایسیستمهای هوش مصنوعی است. دی بی پدیا به عنوان یکی از منابع دانش در [[آیبیام|آی بی ام]] واتسون جاسوسی مورد استفاده قرار گرفت! سیستم برنده
آمازون یک مجموعه اطلاعات دی بی پدیا را فراهم می کندمیکند که می تواندمیتواند در برنامه هایبرنامههای وب سرویس هایسرویسهای آمازون ادغام شود.
== نورافکن دی بی پدیا ==
نورافکن دی بی پدیا یک ابزار برای اعلان اشاره به منابع دی بی پدیا در متن است. این اجازه می دهدمیدهد که منابع اطلاعاتی بدون ساختار را از طریق دی بی پدیا به [[ابر داده]] ابر مرتبط کند. نورافکن دی بی پدیا استخراج نام موسسهمؤسسه نامیده می شود،میشود، از جمله شناسایی نهاد و وضوح نام (به بیان دیگر، ابهام). همچنین می تواندمیتواند برای شناسایی نام شرکت و سایر اطلاعات استخراج اطلاعات مورد استفاده قرار گیرد. هدف نورافکن دی بی پدیا برای قابل تنظیم برای بسیاری از موارد استفاده است. به جای تمرکز بر چند نوع نهاد، این پروژه تلاش می کندمیکند از حاشیه نویسی تمام 3.5۳٫۵ میلیون نهادها و مفاهیم از بیش از 320۳۲۰ کلاس در دی بی پدی حمایت کند. این پروژه در ژوئن 2010۲۰۱۰ در گروه سیستم هایسیستمهای مبتنی بر وب در دانشگاه آزاد برلین آغاز شد.
نورافکن دی بی به عنوان یک سرویس وب برای آزمایش و یک (API) جاوا / مقیاس API مجوز از طریق پروانه آپاچی به صورت عمومی در دسترس است. توزیع نورافکن دی بی پدیا شامل یک پلاگین جی کوئری است که به توسعه دهندگان اجازه می دهدمیدهد صفحات را در هر نقطه از صفحات وب با اضافه کردن یک خط به صفحه خود اضافه کنند. مشتریان نیز در جاوا یا پی اچ پی در دسترس هستند. این ابزار از طریق صفحه آزمایشی و خدمات وب به زبان هایزبانهای مختلفی مدیریت می کندمیکند. بین المللیبینالمللی بودن برای هر زبان ای که نسخه ویکی پدیاویکیپدیا دارد، پشتیبانی می شودمیشود.
== جستارهای وابسته ==
== همچنین نگاه کنید ==
* [[بابلنت]]
* [[ویکی واژگان معنایی]]
|