گرامر درخت مجاورت: تفاوت میان نسخه‌ها

محتوای حذف‌شده محتوای افزوده‌شده
FreshmanBot (بحث | مشارکت‌ها)
جز اصلاح فاصله مجازی با استفاده از AWB
FreshmanBot (بحث | مشارکت‌ها)
جز اصلاح فاصله مجازی + اصلاح نویسه با استفاده از AWB
خط ۱:
'''گرامر درخت مجاورت''' (TAG) یک [[قاعده ی گرامری]] است که توسط آراویند جوشی([[Aravind Joshi]]) تعریف شده استشده‌است. گرامرهای درخت مجاورت تاحدی شبیه [[گرامرهای مستقل از متن]] هستند اما واحد مقدماتی بازنویسی در اینجا به جای نماد، درخت است.
اگرچه گرامرهای مستقل از متن قواعدی برای بازنویسی نمادها به عنوان رشته ایرشته‌ای از سایر نمادها دارند، گرامرهای درخت مجاورت نیز قواعدی برای بازنویسی نودهای درخت‌ها به عنوان سایر درخت‌ها دارند. (بخش [[درخت (نظریه گراف)]] و [[درخت (ساختار داده)]] را ببینید.)
 
== تاریخچه ==
خط ۸۹:
| mr =
| zbl =
| jfm =}}</ref> گرامرهای مجاورت ویژگی هایویژگی‌های درونی مرکزی ([[Endocentric]]) یک زبان را به [[شیوه ای]] طبیعی و مؤثر کنترل می کنندمی‌کنند اما توصیف خوبی از ساختارهای بیرونی مرکزی ([[Exocentric]]) ندارد. صبحت اصلی [[بازنویسی گرامر]] یا [[دستور زبان ساختار عبارت]] (PSG) است.
 
در سال 1969، جوشی یک خانواده از [[دستور زبان]] معرفی کرد که مورد استفاده ی این مکمل، با ترکیب این دو نوع از قوانین قرار می گیردمی‌گیرد. چند قانون بازنویسی بسیار ساده برای تولید واژگان رشته هارشته‌ها که برای بررسی قوانین مورد استفاده قرار می گیرد،می‌گیرد، کافی است. این خانواده از [[سلسله مراتب چامسکی-شواتزنبرگ]](Chomsky-Schützenberger) متمایز است اما به صورتی جالب و زبانی اتصال دارد.<ref name="Joshi1969">{{cite paper
| last = Joshi
| first = Aravind
| title = Properties of Formal Grammars with Mixed Types of Rules and Their Linguistic Relevance
| year = 1969
| publisher = Proceedings Third International Symposium on Computational Linguistics, Stockholm, Sweden}}</ref> رشته هایرشته‌های مرکزی و رشته هایرشته‌های کمکی همچنین می‌تواند توسط [[گرامر وابستگی]] و با اجتناب از محدودیت هایمحدودیت‌های سیستم بازنویسی به طوربه‌طور کامل تولید شوند.<ref name="joshi-rambow2003">{{cite conference
| last = Joshi
| first = Aravind
خط ۱۰۸:
 
== شرح ==
قوانین در TAG ، درختانی با یک گره برگ خاص به نام گره پایانی (انتهایی) می باشندمی‌باشند که به یک کلمه وصل شده استشده‌است. درختان اصلی در TAG دو نوع دارند:
درختان اولیه (که اغلب با '<math>\alpha</math>' نشان داده میشودمی‌شود)
درختان کمکی ('<math>\beta</math>')
درختان اولیه نشان دهنده ی روابط بنیادی است، در حالی که درختات کمکی اجازه بازگشت را می دهدمی‌دهد.<ref name="jurafsky-martin2000">{{cite book
| last = Jurafsky
| first = Daniel
خط ۱۲۰:
| publisher = Prentice Hall
| location = Upper Saddle River, NJ}}</ref>
گره ریشه و گره پایانی درختان کمکی با علامتی یکسان، نشاندار شده اندشده‌اند.
[[اشتقاق]] با یک درخت اولیه شروع می شود،می‌شود، ترکیب از طریق تعویض یا الحاق انجام میشودمی‌شود.
تعویض؛ گره مرزی را با درخت دیگری که گره بالای آن دارای همان برچسب می باشد،می‌باشد، جایگزین می کندمی‌کند.
برچسب گره ریشه / پایانی درخت کمکی باید مطابق با برچسب گره ایگره‌ای باشد که به آن متصل شده استشده‌است.
الحاق در نتیجه می‌تواند تاثیریتأثیری به شکل تلاقی یک درخت کمکی به مرکز یک درخت دیگر داشته باشد.<ref name="joshi-rambow2003"/> سایر مدل هایمدل‌های TAG اجازه ی درختان جز، درختان با گره هایگره‌های متعدد پایانی و دیگر تعمیم هاتعمیم‌ها را می دهدمی‌دهد.
 
== پیچیدگی و کاربرد ==
گرامر درخت مجاورت می‌تواند (از لحاظ توانایی ضعیف تولیدی ) بسیار از [[گرامر مستقل از متن]] قوی تر باشد، اما نسبت به [[سیستم بازنویسی مستقل از متن خطی]]<ref>Kallmeyer, Laura (2010). Parsing Beyond Context-Free Grammars. Springer. Here: p.215-216</ref>، [[گرامر نمایه سازینمایه‌سازی شده]] یا [[گرامر حساس به متن]] کمتر قدرتمند هست.
TAG می‌تواند زبان مربعات (که در ان برخی از رشته هایرشته‌های دلخواه تکرار شده است) و زبان <math>\{a^n b^n c^n d^n | 1 \le n \}</math> را توصیف کند.
این نو ع از پردازش می‌تواند توسط یک [[ماشین پذیرنده ی پشته ای]] تعبیه شده، نمایش داده شود.
زبان هاییزبان‌هایی با توان ۳(برای مثال رشته ایرشته‌ای با ۳ بار تکرار) یا با بیش از چهار رشته کاراکتری متمایز با طول یکسان توسط دستور الحاق درختی قابل ایجاد نیست.
 
به این دلایل، گرامر درخت مجاورت اغلب به صورت [[زبان ملایم حساس به متن]] توصیف می شودمی‌شود.گمان می رودمی‌رود این کلاس هایکلاس‌های دستوری برای مدل کردن [[زبان هایزبان‌های طبیعی]] کافی باشند، در حالی که همچنین در حالت عمومی تا حد مطلوبی قاعده مند می باشندمی‌باشند.<ref name="joshi1985">{{cite book
| last = Joshi
| first = Aravind
خط ۱۴۵:
== هم ارزی ==
 
ویجی-شنکر و ویر (1994) <ref name="vijayshankarAndWeir1995">Vijay-Shanker, K. and Weir, David J. 1994. ''The Equivalence of Four Extensions of Context-Free Grammars''. Mathematical Systems Theory 27(6): 511–546.</ref> نشان داده اند که [[گرامرگرامرهای های نمایه سازینمایه‌سازی شده خطی]]، [[گرامر هایگرامرهای دسته ترکیبی]]، گرامر هایگرامرهای درخت مجاورت و گرامر هد ([[Head Grammars]]) هم ارزی معادل ضعیفی دارند.
 
== گرامر درخت مجاورت لغوی ==
گرامر درخت مجاورت لغوی (LTAG) یک نوع از ATG است که در آن هر درخت ابتدایی(اولیه یا کمکی) با لغت همراه است.
گرامر لغوی برای زبن انگلیسی توسط گروه پژوهشی XTAG موسسهمؤسسه پژوهش در [[علوم شناختی]] در [[دانشگاه پنسیلوانیا]] توسعه داده شده استشده‌است.<ref name="xtagenglish"/>
 
== جستارهای وابسته ==