میکرو-ریسه‌ها

میکرو-ریسه‌ها (به انگلیسی:Micro-Threads) در پردازنده‌های چندهسته‌ای یک روش برای کاهش تأخیر حافظه مانند معماریهای چندریسمانی است. اگرچه این تکنیک در پردازنده‌های چندهسته‌ای برای کاهش تأخیر مربوط به حافظه و عملیات ورودی/خروجی به صورت نرم‌افزاری مانند CellBroadbandEngine پیاده می‌شود.^[۱]

معرفی

میکرو-ریسه یک چهارچوب کاری (به انگلیسی:framework) می‌باشد که تحت نرم‌افزار بوده و یک سری ریسه کوچک درون پردازنده‌های چندهسته‌ای یا چندپردازشی می‌سازد. هر هسته دارای دو یا چند ریسه کوچک می‌باشد که زمان بیکاری پردازنده را بهینه می‌کند. این تکنیک شبیه فراریسمانی (به انگلیسی:hyper-treading) می‌باشد که توسط شرکت اینتل ساخته شد یا شبیه معماری‌های عمومی چندریسمانی در پردازنده‌های چندهسته‌ای می‌باشد. این تکنیک شما را قادر می‌سازد تا با یک هسته مشابه یک یا چند ریسه اجرا شوند بدون اینکه هزینه سرباری برای حافظه اصلی سیستم به خاطر تعویض متن داشته باشیم حتی اگر این هسته دارای سخت‌افزاری منطقی برای چندپردازندگی نداشته باشد. میکرو-ریسه به صورت اساسی تأخیر حافظه را با همزمان کردن محاسبات مربوط به دسترسی حافظه درون هر هسته کاهش می‌دهد. مهم‌ترین فرق بین میکرو-ریسه و مدل‌های امروزی این است که تعویض متن برای میکرو-ریسه سربار خیلی کمی دارد برای مثال سربار پیاده‌سازی میکرو-ریسه بر روی Cell Broadband Engine، حدود ۱۶۰ نانوثانیه طول می‌کشد در حالیکه سربار تعویض متن برای SPE در حدود ۲۰۰۰ میکروثانیه می‌باشد. کم بودن این سربار به خاطر ۳ فاکتور مهم و اساسی است:

میکرو-ریسه‌ها خیلی کوچک هستند. هر میکرو-ریسه در یک یا دو جز ساده (اما بحرانی) اجرا می‌شود.
تعویض متن میکرو-ریسه‌ها فقط شامل رجیستر فایل مربوط به میکرو-ریسه در حال اجرا می‌باشد.
در میکرو-ریسه‌ها تعویض متن به حافظه پنهان اختصاصی هر هسته انجام می‌شود که این باعث افزایش سرعت و کارایی پردازش می‌شود.

پیش زمینه

هرچقدر که ریزپردازنده‌ها سریعتر می‌شوند به دلیل افزایش تعداد هسته‌ها در هر چند ماه محدودهٔ تأخیر حافظه وسیعتر می‌شود. در سال ۱۹۸۰ میلادی تأخیر حافظه چند سیکل بود ولی امروزه به ۱۰۰۰ سیکل رسیده‌است. اگر ریزپردازنده به تعداد کافی هسته داشته باشد و در حالت خوشبینانه در زمان مشابه درخواستی برای دسترسی به حافظه اصلی نداشته باشند ما شاهد کاهش عمده‌ای از تأخیر حافظه خواهیم بود. وقتی که بقیه هسته‌ها در انتظار پاسخ حافظه هستند بعضی از این هسته‌ها باید در حال اجرا باشند. این تکنیک بهترین جانشین برای چندهسته‌ای نمی‌باشد. با مشغول نگه داشتن همه هسته‌ها در همه زمان‌ها کارایی بالای محاسباتی حاصل می‌شود؛ بنابراین اگر هر هسته‌ای در تمام مدت مشغول باشد یک کارایی کامل (۱۰۰ درصد) برای کل پردازنده ممکن خواهد بود. ساختن نرم‌افزارهایی براساس ریسه‌ها این مسئله را حل نخواهد کرد. تعویض متن به حافظه اصلی در مقایسه با تأخیر حافظه یک عملیات خیلی گران می‌باشد. برای مثال در Cell Broadband تعویض متن در بهترین حالت هر ریسه در هسته‌ها ۲۰۰۰ میکروثانیه طول می‌کشد. بعضی از تکنیک‌ها مانند چند بافری ممکن است بتواند مشکل تأخیر حافظه را حل کنند اگرچه آن‌ها می‌توانند در جاهایی که می‌دانند قطعه بعدی که از حافظه می‌آید کدام است از الگوریتمهای منظم استفاده کنند. در این حالت وقتی که حافظه درخواست داده قبلی را پردازش می‌کند یک درخواست به حافظه ارسال می‌شود. اگرچه این تکنیک اگر داده بعدی را ندانیم کدام است کار نخواهد کرد. به عبارت دیگر این تکنیک در الگوریتمهای ترکیبی مانند: پیمایش درخت - رنکینگ تصادفی لیستها کار نخواهد کرد. علاوه بر این تکنیک چند بافری فرض می‌کند که تأخیر حافظه ثابت است و می‌توان آن را به صورت ایستا نشان داد اما حقیقت نشان می‌دهد که تأخیر حافظه از یک app به app دیگر تغییر می‌کند و به بارگذاری کلی روی منابع ریزپردازنده‌ها مانند نرخ درخواست حافظه مشترک برای ارتباطات مشترک بستگی دارد.

پیاده‌سازی فعلی

امروزه میکرو-ریسه‌ها بر روی Cell Broadband پیاده‌سازی شده‌است که می‌تواند کارایی را ۳ تا ۵ برابر افزایش دهد. جدیداً این تکنیک برای الگوریتمهای منظم و ترکیبی آزمایش شده‌است. تلاش‌های دیگری هم برای اثبات امکان استفاده آن برای الگوریتمهای علمی نیز در حال انجام است.

کارایی

میکرو-ریسه بهترین راه حل برای کاهش تأخیر حافظه بر اساس کارایی ریزپردازنده در زمان اجرا می‌باشد. برای مثال اگر تأخیر حافظه در مقایسه با زمان تعویض متن و زمان پردازش بزرگ باشد می‌توان میکرو-ریسه‌های بیشتری اضافه کرد. این اتفاق زمانی می‌افتد که قطعات بزرگ داده از حافظه درخواست می‌شود یا زمانی که حافظه دارای نقاط hot spot (نقاط حساس) زیادی باشد. اگر این مقدار کم باشد میکرو-ریسه‌های کمتری می‌توانند در یک زمان اجرا شوند که به فاکتورهای مرتبط با پیاده‌سازی appها و فاکتورهای مرتبط با زمان اجرای سیستم مربوط است.

انتقادات

اگرچه میکرو-ریسه یک مدل امیدبخش را برای کاهش تأخیر حافظه برای چندپردازنده‌ای فراهم می‌کند اما چند نکته وجود دارد که باید به آن توجه داشت:

این تکنیک احتیاج به پشتیبانی سخت‌افزار نیاز دارد. هر هسته باید امکان وقفه محلی برای زمان‌بندی میکرو-ریسه‌ها داشته باشد. اگر سیاست زمان‌بندی غیرانحصاری دنبال شود سیاست وقفه درون ساختی احتیاج نیست.
این تکنیک زمانی بهترین کارایی را دارد که حافظه پنهان محلی هر هسته به صورت دستی توسط برنامه‌نویس مدیریت شود.
اضافه کردن میکروریسه‌های زیاد در هسته به صورت چشمگیری بار منابع اشتراکی را افزایش می‌دهد. درخواست حافظه بیشتر و همگام سازی باعث تراکم بر روی منابع اشتراکی می‌شود البته این مسئله با کنترل زمان اجرای سیستم برای نقاط بحرانی مانند تأخیر حافظه و کاهش زمان همگانی اجرا با هرگونه کاهش میکرو-ریسه یا بهبود سیاست زمان‌بندی کاهش می‌یابد.

جستارهای وابسته

منابع

↑ Wikipedia contributors, "Micro-Threads (multi core),", December 17, 2012.

[test-1] Wikipedia contributors, "Micro-Threads (multi core),", December 17, 2012.

[۱]