باز کردن منو اصلی
کتاب «استاندارد یونیکد، نسخهٔ ۵٫۰» کنسرسیوم یونی‌کد

یونی‌کُد[۱] (به انگلیسی: Unicode) استانداردی برای کُد کردن نویسه‌های رایانه‌ای و نمایش و پردازش متن به اکثر زبان‌های دنیا[۲] است. هر زبان یک قالب یونی‌کد دارد.

این استاندارد هماهنگ با مجموعه جهانی نویسه‌ها تألیف شده‌است و به صورت کتابی به نام 'The Unicode Standard' منتشر شده‌است. آخرین ویرایش این استاندارد شامل بیش از ۱۱۰۰۰۰ نویسه و ۱۰۰ نماد، مجموعه‌ای از نمودارهای کد برای مرجع تصویری، روش رمزگذاری و مجموعه‌ای از استاندارد رمزگذاری کاراکتر، شمارش خواص شخصیت مانند حروف بزرگ و کوچک، مجموعه‌ای از مرجع فایل‌های داده‌های کامپیوتر و تعدادی موارد مربوط مانند جزئیات نویسه، برابری یونیکد، رندر کردن، نظم و صفحه نمایش دو جهته (برای نمایش صحیح متن حاوی اسکریپت راست به چپ مانند عربی، فارسی و عبری، و اسکریپت‌های سمت چپ به راست) می‌باشد. تا تاریخ مارس ۲۰۱۹، آخرین ویرایش، یونیکد ۱۲٫۰ است.

موفقیت یونیکد در یکی کردن کد بندی نویسه‌ها سبب استفاده گسترده اش در جهانی‌سازی و بومی‌سازی نرم‌افزارها شده‌است. این استاندارد در بسیاری از فناوری‌های اخیر پیاده شده‌است از جمله: اکس ام ال، زبان برنامه‌نویسی جاوا، چارچوب دات نت مایکروسافت و سیستم عامل‌های مدرن.

یونیکد می‌تواند توسط کدبندی‌های مختلفی پیاده‌سازی شود. پرکاربردترین رمز نگاری‌ها عبارت اند از: UTF-8، و UCS-2 که دیگر اعتبار ندارد، و UTF-16.

کدبندی UTF-8 برای کدبندی‌های موجود در استاندارد اسکی تنها ۱ بایت استفاده می‌کند. کد نویسه‌های موجود در رمز نگاری اسکی، در هر دو کدبندی یکی است. این رمز نگاری حداکثر ۴ بایت برای هر نویسه استفاده می‌کند.UCS-2 برای تمام نویسه‌ها از ۲ بایت استفاده می‌کند بنابراین نمی‌تواند تمام نویسه‌های موجود در استاندارد فعلی یونیکد را کدبندی کند. UTF-16 کدبندی UCS-2 را گسترش می‌دهد و برای نویسه‌های باقی‌مانده از ۴ بایت استفاده می‌کند.

محتویات

تاریخچه و توسعهویرایش

هدف یونیکد رفع محدودیت‌های موجود در کدبندی نویسه‌های قدیمی است، مانند کدبندی‌هایی که بر پایه استاندارد ISO 8859 تعریف شده‌اند، که استفاده گسترده‌ای در کشورهای مختلف پیدا کرده‌اند، ولی با یکدیگر سازگار نیستند. بسیاری از کدبندی‌های قدیمی این مشکل مشترک را دارند که امکان پردازش متن‌های دوزبانه (معمولا به وسیله نویسه‌های لاتین و نمادهای محلی) را فراهم می‌کنند، ولی پردازش بیش از دو زبان را ممکن نمی‌کنند.

نقش یونیکد در پردازش متن این است که به جای یک تصویر برای هر نویسه یک کد منحصر به فرد ارائه می‌کند. به عبارت دیگر، یونیکد یک نویسه را به صورت مجازی ارائه می‌کند و کار ساخت تصویر (شامل اندازه، شکل، قلم، یا سبک) نویسه را به عهده نرم‌افزار دیگری مانند مرورگر وب یا واژه‌پرداز می‌گذارد.

یونیکد در ویندوزویرایش

در ویندوز ای‌پی‌آی توابع یونیکد با پسوند W می‌آیند. (مثال: CreateWindowExW) پسوند W حرف اول عبارت wide character است که در زبان‌های برنامه‌نویسی انواع داده‌ای که یونیکد را پشتیبانی می‌کنند اسامی مشابهی مانند WCHAR دارند و گاهی به آن نویسهٔ چندبایتی (به انگلیسی: multibyte character) نیز گفته می‌شود.

جستارهای وابستهویرایش

پیوند به بیرونویرایش

پانویسویرایش

منابعویرایش

  • «یونی‌کد چیست؟». ترجمهٔ روزبه پورنادر. کنسرسیوم یونی‌کد. دریافت‌شده در ۱۰ ژوئیهٔ ۲۰۰۹.
  • مشارکت‌کنندگان ویکی‌پدیا. «Unicode». در دانشنامهٔ ویکی‌پدیای انگلیسی، بازبینی‌شده در ۱۱ ژوئن ۲۰۰۹.