فشرده‌سازی داده‌ها: تفاوت میان نسخه‌ها

محتوای حذف‌شده محتوای افزوده‌شده
Rezabot (بحث | مشارکت‌ها)
جز تمیزکاری و اصلاح متن با استفاده از AWB
خط ۸:
 
== فشرده سازی بهینه در مقابل اتلافی ==
[[الگوریتم]]‌های فشرده سازی بهینه معمولاً فراوانی آماری را به طریقی به کار می‌گیرند که بتواند اطلاعات فرستنده را اجمالی تر و بدون خطا نمایش دهد. فشرده سازی بهینه امکان‌پذیر است چون اغلب اطلاعات جهان واقعی دارای فراوانی آماری هستند. برای مثال در زبان فارسی حرف "الف" خیلی بیش تر از حرف "ژ" استفاده می‌شود و احتمال اینکه مثلاً حرف "غین" بعد از حرف "ژ" بیاید بسیار کم است. نوع دیگری از فشرده سازی، که فشرده سازی پر اتلاف یا کدگذاری ادراکی نام دارد که در صورتی مفید است که درصدی از صحت اطلاعات کفایت کند. به طور کلی فشرده سازی اتلافی توسط جستجو روی نحوهٔ دریافت اطلاعات مورد نظر توسط افراد راهنمایی می‌شود. برای مثال، [[چشم انسان]] نسبت به تغییرات ظریف در روشنایی حساس تر از تغییرات در رنگ است. [[فشرده سازی تصویر]] به روش [[ویکی‌پدیا:JPEG | JPEG]] طوری عمل می‌کند که از بخشی از این [[اطلاعات کم]] ارزش تر "صرف نظر" می‌کند. فشرده سازی اتلافی روشی را ارائه می‌کند که بتوان بیشترین صحت برای درصد فشرده سازی مورد نظر را به دست‌آورد. در برخی موارد فشرده سازی شفاف (نا محسوس) مورد نیاز است؛ در مواردی دیگر صحت قربانی می‌شود تا حجم اطلاعات تا حد ممکن کاهش بیابد.
 
روش‌های فشرده سازی بهینه برگشت پذیرند به نحوی که اطلاعات اولیه قابلیت بازیابی به طور دقیق را دارند در حالی که روش‌های اتلافی، از دست دادن مقداری از اطلاعات را برای دست یابی به فشردگی بیشتر می‌پذیرند.
خط ۲۶:
 
== الگوریتم‌ها و برنامه‌های اجرایی نمونه ==
مثال فوق مثال بسیار ساده‌ای از یک [[رمزنگاری الگو-طول]] ([[کدبندی طول اجرا]]، که در آن "الگو" عبارت است از رشته‌ای از عناصر که به طور متوالی تکرار شده است و "طول" تعداد تکرار آن است) است. این روش اغلب برای [[بهینه‌سازی]] فضای دیسک در کامپیوترهای اداری و یا استفادهٔ بهتر از طول باند اتصال در یک شبکهٔ کامپیوتری به کار می‌رود. برای داده‌های نمادی مانند متن‌ها، صفحه گسترده‌ها ([[ویکی‌پدیا:Spreadsheet | Spreadsheet]])، برنامه‌های اجرایی و… غیراتلافی بودن ضروری است زیرا تغییر کردن حتی یک بیت داده قابل قبول نمی‌باشد (مگر در موارد بسیار محدود). برای داده‌های صوتی و تصویری کاهش قدری از کیفیت بدون از دست دادن طبیعت اصلی داده قابل قبول می‌باشد. با بهره بردن از محدودیت‌های سیستم حواسی انسان، می‌توان در حجم زیادی از فضا صرفه جویی کرد و در عین حال خروجی ای را تولید کرد که با اصل آن تفاوت محسوسی ندارد. این روش‌های [[فشرده سازی اتلافی]] به طور کلی یک برآیند گیری سه جانبه بین سرعت فشرده سازی، حجم نهایی فشرده سازی و میزان کیفیت قابل چشم پوشی (درصد اتلاف قابل قبول) است.
 
== نظریه ==
سابقهٔ نظری فشرده سازی برای فشرده سازی‌های بهینه توسط [[نظریهٔ اطلاعات]] (که رابطه نزدیکی با نظریهٔ اطلاعات الگوریتمی دارد) و برای فشرده سازی‌های اتلافی توسط [[نظریهٔ آهنگ-پیچیدگی]] ([[ویکی‌پدیا:Rate–distortion theory | Rate–distortion theory]]) ارائه شده‌اند. این شاخه‌های مطالعاتی در اصل توسط کلوده شانون([[ویکی‌پدیا:Claude Shannon | Claude Shannon]])، که مقالاتی بنیادی در این زمینه در اواخر دهه‌ای ۱۹۴۰ و اوایل دههٔ ۱۹۵۰ به چاپ رسانده است به وجود آمده. "[[رمزنگاری]]" و "[[نظریهٔ رمزگذاری]]" نیز رابطه بسیار زیادی با این زمینه دارند. ایدهٔ فشرده سازی رابطهٔ عمیقی با [[آمار استنباطی]] دارد.
 
== فرمت های فشرده سازی ==
خط ۵۲:
== منابع ==
{{پانویس}}
* [[:w:en:Data_compressionData compression|Data Compression - Wikipedia]]
* [http://navatrump.de/Technology/Datacompression/compression.html Data Compression - Systematisation by T.Strutz]