نظریه اطلاعات: تفاوت میان نسخه‌ها

محتوای حذف‌شده محتوای افزوده‌شده
جز ویرایش به‌وسیلهٔ ابرابزار:
←‏قضایای شانون: تصحیح فنی و نوشتاری متن.
برچسب‌ها: متن دارای ویکی‌متن نامتناظر ویرایشگر دیداری
خط ۱:
{{نظریه اطلاعات}}
'''نظریه اطلاعات'''، [[مدل ریاضی|مدلی ریاضی]] از شرایط و عوامل مؤثر در پردازش و انتقال [[داده‌ها]] و [[اطلاعات]] فراهم می‌آورد. نظریهٔ اطلاعات با ارائهٔ روشی برای «کمّی‌سازی و اندازه‌گیری عددی اطلاعات» به موضوعاتی مانند ارسال، دریافت، و ذخیره‌سازی بهینهٔ داده‌ها و اطلاعات می‌پردازد. تمرکز اصلی این نظریه بر روی محدودیت‌های بنیادین ارسال و تحلیل داده‌ها است، و کمتر به نحوهٔ عملکرد دستگاه‌های خاص می‌پردازد. پیدایش این نظریه عموماً به یک مهندس برق به نام [[کلاود شانون|کلود شانون]]<ref group="پانویس">Claude Elwood Shannon</ref> در سال ۱۹۴۸ میلادی نسبت داده می‌شود.

نظریه اطلاعات مورد استفاده خاص مهندسان مخابرات بوده،است، هرچند از برخی از مفاهیم آن در رشته‌های دیگری مانند [[روان‌شناسی]]، [[زبان‌شناسی]]، [[کتابداری و اطلاع‌رسانی|کتاب‌داری و اطلاع‌رسانی]]، و [[اطلاعات و دانش‌شناسی|علومِ شناختی]] (Cognitive Sciences) نیز مورد استفاده قرار گرفته‌استمی‌شود.<ref name="Britanica">«information theory," Encyclopædia Britannica</ref>

مفهوم اطلاعاتی که توسط شانون مطالعه شد، از دید ''آمار و احتمالات'' بوده و با مفاهیم روزمره اطلاعات مانند «دانش» یا استفاده‌های روزمره از آن در زبان طبیعی مانند «بازیابی اطلاعات»، «تحلیل اطلاعات»، «چهارراه اطلاعات» و غیره تفاوت دارد. اگر چه نظریه اطلاعات رشته‌های دیگر مانند روان‌شناسی و فلسفه را تحت تأثیر قرار داده، ولی بدلیل مشکلات تبدیل «مفهوم آماری اطلاعات» به «مفهوم معنایی دانش و محتوا» تأثیراتش بیشتر از نوع القای احساساتی نسبت به مفهوم اطلاعات بوده‌است.<ref name="SAYRE, KENNETH M. 1998">SAYRE, KENNETH M. (1998). Information theory. In E. Craig (Ed.), Routledge Encyclopedia of Philosophy. London: Routledge.</ref>
 
== تاریخچه ==
سطر ۶ ⟵ ۱۰:
 
تحقیق دربارهٔ نظریه اطلاعات اولین بار در سال ۱۹۲۴ توسط [[هری نایکوئیست]]<ref group="پانویس">Harry Nyquist</ref> در مقاله‌ای به نام «عوامل خاصی که سرعت تلگراف را تحت تأثیر قرار می‌دهند»<ref group="پانویس">Certain Factors Affecting Telegraph Speed</ref> آغاز شد. نایکویست وجود نرخ ماکسیمم ارسال اطلاعات را متوجه شده و فرمولی برای محاسبه آن ارائه کرد. کار مهم دیگر در این زمان، مقاله «انتقال اطلاعات» در سال ۱۹۲۸ میلادی توسط هارتلی<ref group="پانویس">R.V.L. Hartley</ref> بود که اولین پایه‌های ریاضی نظریه اطلاعات را بنا گذاشت.<ref name="Britanica" />[[پرونده:ClaudeShannon MFO3807.jpg|بندانگشتی|چپ|150 px|کلود شانون]]
تولد واقعی نظریه اطلاعات را می‌توان به مقاله «نظریه ریاضی مخابرات»<ref group="پانویس">The Methematical Theory of Communication</ref> توسط [[کلاود شانون|کلود شانون]] نسبت داد. یکی از نکات اصلی مقاله شانون توجه به این نکته بود که بررسی سیگنال‌های مخابراتی را باید از بررسی اطلاعاتی که آن سیگنال‌ها حمل می‌کنند جدا کرد، در حالی که پیش از او چنین نبود. شانون همچنین به این نکته توجه کرد که طول یک سیگنال همیشه متناسب با میزان اطلاعات آن نیست. مثلاً نقل شده‌است که در نامه‌ای که [[ویکتور هوگو]] به ناشرش نوشت، فقط نماد «؟» را نوشته بود. در پاسخ نامه‌ای دریافت کرد که فقط حاوی نماد «!» بود. این دو نماد برای هر دو طرف حاوی اطلاعات زیادی می‌باشد، هرچند از دید ناظری که معانی آن‌ها را نداند، بی‌معنی هستند. مثال دیگر، جمله‌ای طولانی است که به زبان فارسی نوشته شده باشد، ولی برای یک انگلیسی زبانی که فارسی نمی‌داند مفهومی ندارد. بدین سانبدین‌سان شانون پیشنهاد کرد که مسئله ارسال سیگنال‌ها را از ارسال اطلاعات موجود در آن‌ها جدا کرده، و برای موضوع اول نظریه ریاضی ای ارائه کرد.<ref name="Britanica" />
 
شانون در آن زمان در آزمایشگاه‌های بل<ref>Bell Laboratories</ref> مشغول به کار بود و سعی در طراحی خطوط تلفن با ضریب اعتماد بالا داشت. پیش از شانون عوامل مؤثر در استفاده بهینه از خطوط تلفن شناخته نشده بود و تعداد حداکثر مکالمات تلفنی که می‌توان روی خطوط تلفن موجود انجام داد نامشخص بود. شانون پس از ارائه تعریفی ریاضی از [[کانال مخابراتی]]، ''[[ظرفیت کانال|ظرفیتی]]'' به کانال مخابراتی نسبت داد که بیانگر میزان حداکثر اطلاعاتی است که روی کانال می‌توان مخابره کرد. فرمول ظرفیت کانال شانون نه تنها به کانال‌های بدون اغتشاش (بدون [[نویز]])، بلکه حتی به کانال‌های با اغتشاش واقعی نیز قابل اعمال بود. شانون فرمولی ارائه کرد که نحوه تأثیر [[پهنای باند کانال]]، و نسبت توان سیگنال ارسالی به توان نویز ([[نسبت سیگنال به نویز]]) را بر ظرفیت کانال نشان می‌داد.<ref name="Britanica" />
سطر ۱۴ ⟵ ۱۸:
 
آمار و احتمالات نقشی حیاتی و عمده در ظهور و رشد نظریه اطلاعات برعهده دارد.
* آنتروپی اطلاعات
 
== قضایای شانون ==
در این نظریه، [[کلاود شانون]] نحوهٔ [[مدل‌سازی]] مسئله ارسال اطلاعات در یک [[کانال مخابراتی]] را به صورت پایه‌ای بررسی کرده، و مدل ریاضی کاملی برای منبع اطلاعات، کانال ارسال اطلاعات و بازیابی اطلاعات ارائه نموده‌استکرده‌است. او مسئلهٔ ارسال اطلاعات از یک منبع به یک مقصد را به کمک علم احتمالات بررسی و تحلیل کرد. دو نتیجهٔ بسیار مهم، معروف به [[قضیه]]‌های شانون، عبارت‌اند از:
* حداقل میزانی که می‌توان نرخ فشرده[[فشرده‌سازی کردنداده‌ها|فشرده‌کردن اطلاعات]] یک منبع تصادفی اطلاعات را به آن محدود نمودتصادفی، برابر با [[آنتروپی اطلاعات|آنتروپی]] آن منبع است؛ به عبارت دیگر نمی‌توان دنباله خروجی از یک منبع اطلاعات را با نرخی کمتر از آنتروپی آن منبع ارسال نمودکرد.
* حداکثر میزاننرخ نرخیارسال که می‌توان براطلاعات روی یک کانال مخابراتیمخابراتی، اطلاعاتطوری‌که ارسالبتوان نموداطلاعات بهرا نحویبا که[[نرخ قادر به آشکارسازی اطلاعات در مقصد، باخطای بیت|احتمال خطای]] در حد قابل قبول کم،کم باشیم،در مقصد بازیافت، مقداری ثابت و وابسته به مشخصات کانال است، که به آنو [[ظرفیت کانال]] می‌گوئیمنام دارد. ارسال اطلاعات با نرخی بیشتر از ظرفیت یک کانال روی آن منجرکانال، به خطا می‌شودمی‌انجامد.
 
این زمینهدو از مخابرات،نتیجه، به ترتیب به زیربخش‌های [[کدگذاری منبع|کُدینگ منبع]] (source coding) و [[کدگذاری کانال|کدینگ کانال]] (channel coding) تقسیم می‌شودمی‌انجامند. از زیرشاخه‌هایموضوعات مرتبط با کدینگ کانال، می‌توان به [[نظریه کدینگ جبری کانال]] (Algebraic coding theory) را ناماشاره بردکرد.
 
البته بخش دیگری از کار شانون به مسئله '''امنیت''' انتقال اطلاعات (information security) می‌پردازد که ربط مستقیمی به دو نتیجه بالا ندارد و مبنای نظری [[رمزنگاری]] (cryptography) نوین است. به عبارت بهتر، مسئله '''اطمینان''' انتقال اطلاعات (information reliability) که با دو نتیجه بالا توصیف می‌شود را نباید با مسئله امنیت انتقال اطلاعات (information security) اشتباه گرفت؛ هدف این دو کاملاً متفاوت است.
 
== کمیت‌های مربوط به اطلاعات ==
نظریه اطلاعات بر مبنای ''[[نظریه احتمالات|نظریهٔ احتمالات]] و [[فرایند تصادفی|فرایندهای اتفاقی'']] (Probability Theory and Stochastic Processes) به وجود آمده‌است. مهم‌ترین کمیت‌های مربوط به اطلاعات عبارتند از:
 
''آنتروپی'' (که میانگین محتوای اطلاعاتی یک منبع اطلاعات است) و ''اطلاعات متقابل'' (که مقدار اطلاعات مشترک بین دو متغیر تصادفی است). کمیت اول (آنتروپی)، به ما نشان می‌دهد که اطلاعات خروجی یک منبع اطلاعات تا چه حد می‌تواند ''فشرده'' شود؛ در حالی که کمیت دوم ([[اطلاعات متقابل]])، می‌تواند برای یافتن سرعت ارتباط در یک ''کانال'' مورد استفاده قرار گیرد.
* [[آنتروپی اطلاعات|آنتروپی]]، که میانگین محتوای اطلاعاتی یک منبع اطلاعات است، و
* [[اطلاعات متقابل]]، که مقدار اطلاعات مشترک دو متغیر تصادفی است.
 
''آنتروپی'' (که میانگین محتوای اطلاعاتی یک منبع اطلاعات است) و ''اطلاعات متقابل'' (که مقدار اطلاعات مشترک بین دو متغیر تصادفی است). کمیت اول (آنتروپی)، به ما نشان می‌دهد که اطلاعات خروجی یک منبع اطلاعات تا چه حد می‌تواند ''[[فشرده‌سازی داده‌ها|فشرده'']] شود؛ در حالی که کمیت دوم ([[اطلاعات متقابل]])، می‌تواندنرخ برایانتقال یافتن سرعت ارتباطاطلاعات در یک ''[[کانال'' موردمخابراتی]] استفادهرا قرارتعیین گیردمی‌کند.
 
انتخاب مبنای لگاریتم در فرمول زیر، نوع واحد آنتروپی اطلاعات را مشخص می‌کند. رایج‌ترین واحد اطلاعات، بیت است که بر مبنای لگاریتم دودویی (باینری) است. دیگر واحدها شامل نَت (بر اساس لگاریتم طبیعی) و هارتلی (بر اساس لگاریتم معمولی) هستند. انتخاب مبنای لگاریتم، نوع واحد آنتروپی اطلاعات را مشخص می‌کند.
 
در عبارت <math>p \log p</math>، زمانی که <math>p=0</math> است، عبارت هم برابر صفر در نظر گرفته می‌شود، زیرا <math>\lim_{p \rightarrow 0+} p \log p = 0</math>
انتخاب مبنای لگاریتم در فرمول زیر، نوع واحد آنتروپی اطلاعات را مشخص می‌کند. رایج‌ترین واحد اطلاعات، بیت است که بر مبنای لگاریتم دودویی (باینری) است. دیگر واحدها شامل نَت (بر اساس لگاریتم طبیعی) و هارتلی (بر اساس لگاریتم معمولی) هستند.
پیرو مطالب قبل، در یک عبارت به شکل <math>p \log p</math> ، زمانی که <math>p=0</math> است، طبق قرارداد، عبارت هم برابر صفر در نظر گرفته می‌شود. این مطلب به راحتی اثبات می‌شود؛ چون مقدار حدی p log p هنگامی که مقدار p همسایگی راست صفر میل می‌کند، برابر با صفر است.
<math>\lim_{p \rightarrow 0+} p \log p = 0</math>
 
== آنتروپی ==
[[پرونده:Binary entropy plot.svg|بندانگشتی|چپ|200 px|آنتروپی متغیر تصادفی برنولی به صورت تابعی از احتمال موفقیت، اغلب به نام تابع باینری آنتروپی نامیده می‌شود.<math>H_\mbox{b}(p)</math>.
مقدار آنتروپی در ۱ بیشینه است در هر آزمایشی که دو نتیجهٔ ممکن به‌طور مساوی محتملند؛ همانند شیر یا خط آوردن یک سکه به‌طور بی طرفانه.]]
[[آنتروپی<math>H</math> اطلاعات|آنتروپی]] یک متغیر تصادفی<math>X</math>،تصادفی، با اندازه‌گیری احتمالات مربوطآن بهمتغیر مقدار <math>X</math>بهتصادفی دستبه‌دست می‌آید.
 
== جستارهای وابسته ==