فشردهسازی دادهها: تفاوت میان نسخهها
محتوای حذفشده محتوای افزودهشده
جز ویکیسازی رباتیک(۶.۷) >فشرده سازی تصویر، منابع اطلاعاتی، نظریهٔ اطلاعات، آمار استنباطی، علوم کامپیوتر،... |
|||
خط ۱:
'''کدگذاری منبع''' روشهای فشردهسازی یک منبع اطلاعات را مطالعه میکند. [[منابع اطلاعاتی]] طبیعی، مانند گفتار یا نوشتار انسانها، دارای [[افزونگی]] است؛ برای مثال در جمله «من به
در [[علوم کامپیوتر]] و نظریه اطلاعات، فشرده سازی دادهها یا کد کردن داده ها، در واقع فرایند رمزگذاری اطلاعات با استفاده از تعداد بیت هایی (یا واحدهای دیگر حامل داده) کمتر از آنچه یک تمثال رمزگذاری نشده از همان اطلاعات استفاده میکند و با به کار گرفتن روشهای رمزگذاری ویژه ای است.
مانند هر ارتباطی، ارتباطات با اطلاعات فشرده، تنها زمانی کار میکند که هم فرستنده و هم گیرندهٔ اطلاعات، روش رمزگذاری را بفهمند.به عنوان مثال این نوشته تنها زمانی مفهوم است که گیرنده متوجه باشد که هدف پیاده سازی با استفاده از [[زبان فارسی]] بوده. به همین ترتیب، دادهٔ فشرده سازی شده تنها زمانی مفهوم است که گیرنده روش رمزگشایی آن را بداند.
فشرده سازی به این دلیل مهم است که کمک میکند مصرف منابع با ارزش، مانند فضای [[هارد دیسک]] و یا [[پهنای باند]] ارسال، را کاهش دهد. البته از طرفی دیگر، اطلاعات فشرده سازی شده برای اینکه مورد استفاده قرار بگیرند باید از حال فشرده خارج شوند و این فرایند اضافه ممکن است برای بعضی از برنامههای کاربردی زیان آور باشد. برای مثال یک روش فشرده سازی برای یک فیلم ویدئویی ممکن است نیازمند تجهیزات و سختافزار گران قیمتی باشد که بتواند فیلم را با سرعت بالایی از حالت فشرده خارج سازد که بتواند به طور همزمان با رمزگشایی پخش شود(گزینه ای که ابتدا رمزگشایی شود و سپس پخش شود، ممکن است به علت کم بود فضای برای فیلم رمزگشایی شده حافظه امکان پذیر نباشد). بنابراین طراحی روش فشرده سازی نیازمند موازنه و برآیندگیری بین عوامل متعددی است. از جمله این عوامل درصد فشرده سازی، میزان پیچیدگی معرفی شده (اگر از یک روش فشرده سازی پر اتلاف استفاده شود) و منابع محاسباتی لازم برای فشرده سازی و رمزگشایی اطلاعات را می توان نام برد. فشرده سازی به دو دسته فشردهسازی اتلافی ([[فشردهسازی با اتلاف]]) و فشردهسازی بهینه [[فشردهسازی بیاتلاف اطلاعات]] تقسیم میشوند. کدگذاری منبع ، علم مطالعه روشهای انجام این عمل ، برای منابع متفاوت اطلاعاتی موجود است.
==== فشرده سازی بهینه در مقابل اتلافی ====
[[الگوریتم]] های فشرده سازی بهینه معمولاً فراوانی آماری را به طریقی به کار می گیرند که بتوان اطلاعات فرستنده را اجمالی تر و بدون خطا نمایش دهند. فشرده سازی بهینه امکان پذیر است چون اغلب اطلاعات جهان واقعی دارای فراوانی آماری هستند. برای مثال در زبان فارسی حرف "الف" خیلی بیش تر از حرف "ژ" استفاده می شود و احتمال اینکه
روشهای فشرده سازی بهینه برگشت پذیرند به نحوی که اطلاعات اولیه قابلیت بازیابی به طور دقیق را دارند در حالی که روشهای اتلافی، از دست دادن مقداری از اطلاعات را برای دست یابی به فشردگی بیشتر می پذیرند.
البته همواره برخی از داده وجود دارند که الگوریتمهای فشرده سازی بهینهٔ اطلاعات در فشرده سازی آنها ناتوان اند. در واقع هیچ الگوریتم فشرده سازی ای
در عمل، فشرده سازی اتلافی نیز به مرحله ای می رسد که فشرده سازی مجدد دیگر تأثیری ندارد، هرچند یک الگوریتم بسیار اتلافی،
مثالی از یک الگوریتم اتلافی در مقابل یک الگوریتم بهینه، می توان رشتهٔ مقابل است:
خط ۲۱:
8[9]25
که خوانده میشود "بیست و پنج ممیز ۹ تا هشت"، و [[رشتهٔ اصلی]] دقیقاً بازسازی میشود و تنها به شکل کوچک تری نوشته می شود. در عوض در روش اتلافی از
26
استفاده میشود که مقدار دقیق عبارت در ازای حجم کمتر از دست خواهد رفت.
==== الگوریتمها و برنامههای اجرایی نمونه ====
مثال فوق مثال بسیار ساده ای از یک رمزنگاری الگو-طول ([[کدبندی طول اجرا]]، که در آن "الگو" عبارت است از رشته ای از عناصر که به طور متوالی تکرار شده است و "طول" تعداد تکرار آن است) است. این روش اغلب برای [[بهینه سازی]] فضای دیسک در کامپیوترهای اداری و یا استفادهٔ بهتر از طول باند اتصال در یک شبکهٔ کامپیوتری به کار می رود. برای دادههای نمادی مانند متن ها، صفحه گستردهها ([[ویکیپدیا:Spreadsheet | Spreadsheet]])، برنامههای اجرایی و… غیراتلافی بودن ضروری است زیرا تغییر کردن حتی یک بیت داده قابل قبول
== نظریه ==
سابقهٔ نظری فشرده سازی برای فشرده سازیهای بهینه توسط [[نظریهٔ اطلاعات]] (که رابطه نزدیکی با نظریهٔ اطلاعات الگوریتمی دارد) و برای فشرده سازیهای اتلافی توسط نظریهٔ آهنگ-پیچیدگی ([[ویکیپدیا:Rate–distortion theory | Rate–distortion theory]]) ارائه شده اند. این شاخههای مطالعاتی در اصل توسط کلوده شانون([[ویکیپدیا:Claude Shannon | Claude Shannon]])، که مقالاتی بنیادی در این زمینه در اواخر دهه ای ۱۹۴۰ و اوایل دههٔ ۱۹۵۰ به چاپ رسانده است به وجود آمده. "رمزنگاری" و "نظریهٔ رمزگذاری" نیز رابطه بسیار زیادی با این زمینه دارند. ایدهٔ فشرده سازی رابطهٔ عمیقی با [[آمار استنباطی]] دارد.
== آنتروپی ==
دو جملهٔ زیر را در نظر میگیریم:
سطر ۴۷ ⟵ ۴۶:
== منابع ==
{{پانویس}}
* [[:w:en:Data_compression|Data Compression - Wikipedia]]
* [http://navatrump.de/Technology/Datacompression/compression.html Data Compression - Systematisation by T.Strutz]
سطر ۵۷ ⟵ ۵۶:
{{روشهای فشردهسازی}}
[[رده:صوتی دیجیتال]]▼
[[رده:فشردهسازی دادهها]]
[[رده:تلفن تصویری]]
[[رده:تلویزیون دیجیتال]]
[[رده:ذخیرهسازی دادهها]]
▲[[رده:صوتی دیجیتال]]
[[رده:علوم رسمی]]
[[رده:فناوری فیلم و ویدئو]]
[[رده:مهندسی صوت]]
[[رده:
|