معیار چالش اچ‌پی‌سی

معیار چالش اچ‌پی‌سی (high-performance computer),[۱] دارای تعداد بسیاری معیار[۲] برای امتحان کردن تعداد ویژگی‌های مستقل عملکرد سیستم HPC (کارایی بالای یک کامپیوتر) می‌باشد. این پروژه توسط برنامهٔ سیستم‌های کامپیوتری با کارایی بالای DARPA[۳] , وزارت انرژی ایالات متحدهٔ آمریکا مورد حمایت ملی قرار گرفته‌است.

متن ویرایش

عملکرد برنامه‌های پیچیده روی سیستم‌های HPC می‌تواند به انواع ویژگی‌های عملکرد مستقل سخت‌افزار بستگی داشته باشد، معیار چالش HPC تلاش برای بهبود دید در فضای چند بعدی با ترکیب کردن مقدار اندازه‌گیری شدهٔ این ویژگی‌ها به یک برنامهٔ واحد است. با اینکه مشخصه‌های عملکردی برای ساختار خود کامپیوتر نیست اما فرض بر این است که پیاده‌سازی مرجع معیار چالش HPC در MPI در سیستم تحت آزمایش انبوه از سیستم پردازشگر است که دارای حافظهٔ مشترکی هستند و به شبکه متصل می‌باشند. با توجه به این فرض در یک ساختار پایگانی شده اکثر آزمایش‌ها در چند حالت مختلف عملیاتی اجرا می‌شود.

با دنبال کردن نماده استفاده شده در گزارش معیار، می‌توان نتایجی را متوجه شد. به عنوان مثال نتیجهٔ نماد «single» به این معناست که آزمایش بر روی یک پردازشگر تصادفی در سیستم اجرا شده‌است، نتیجهٔ نماد «star» به این معنا است که یک کپی مستقل از آزمایش به‌طور همزمان روی هر پردازنده در سیستم اجرا می‌شود، نتیجهٔ نماد «global» به این معنا است که تمام پردازنده‌ها برای حل یک مشکل با هماهنگی کار می‌کنند.

اجزاء ویرایش

این معیار در حال حاضر شامل هفت آزمایش می‌باشد .(با حالت عملیات نشان داده شده برای هر کدام)

  1. HPL[۴] (High Performance LINPACK) - اندازه‌گیری عملکرد یک حل کننده برای یک سیستم متریک معادلات خطی (global)
     
    PDP-12-Update-Uppsala
  2. DGEMM[۵] - اندازه‌گیری عملکرد برای ضرب ماتریس در ماتریس (single, star)
  3. STREAM[۶] - اندازه‌گیری پهنای باند حافظه (single, star)
  4. PTRANS - سیستمی را اندازه‌گیری می‌کند که در آن، سیستم می‌تواند آرایهٔ بزرگی را انتقال دهد. (global)
  5. RandomAccess[۷] (دسترسی تصادفی) - سرعت به روز رسانی ۶۴ بیت را که عناصر آن به صورت تصادفی از یک جدول بزرگ انتخاب شده‌است اندازه‌گیری می‌کند. (single, star, global)
  6. (FFT (Fast Fourier Transform[۸] - یک تبدیل سریع فوریه (Fourier) را با استفاده از تعمیم الگوریتم کولی - توکی (Cooley–Tukey[۹]) بر روی یک بردار بزرگ یک بعدی انجام می‌دهد.
  7. Communication Bandwidth and Latency (پهنای باند ارتباطات و تأخیر زمانی) - اندازه‌گیری‌های محور عملکرد MPI بر اساس b_eff[۱۰] (معیار پهنای باند، معیار تأخیر)

ویژگی‌های عملکرد ویرایش

در سطح بالا آزمایش‌هایی در نظر گرفته شده‌است تا چهار ویژگی مهم عملکرد را پوشش دهد.

دو خرده نمایی شناور، ارزیابی نقطه ای (DGEMM ,HPL)، پهنای باند حافظهٔ محلی (STREAM)، پهنای باند شبکه برای پیام‌های طولانی (PTRANS, RandomAccess, FFT, b_eff) و پهنای باند شبکه برای پیام‌های کوتاه (RandomAccess, b_eff)

برخی از این کدها پیچیده ار تز بقیه هستند و می‌توانند سیاست‌های عملکردی بیشتری داشته باشند. به‌طور مثال، در برخی از سیستم‌ها ی عملکرد HPL را می‌توان با پهنای باند شبکه یا زمان تأخیر شبکه محدود کرد.

رقابت ویرایش

مسابقه جایزه سالانه HPC Challenge در کنفرانس Supercomputing[۱۱] بر چهار معیار چالش‌برانگیز در این مجموعه متمرکز است:

  • HPL جهانی
  • دسترسی تصادفی جهانی (معیار دسترسی تصادفی BSS[۷])
  • EP STREAM (سه‌گانه) در هر سیستم
  • FFT جهانی

و همچنین دو نوع جایزه وجود دارد:

جایزهٔ ۱:[۱۲] بهترین عملکرد در یک پایگاه با اجرای بهینه شده که به وب سایت چالش HPC ارائه شده‌است.

جایرهٔ ۲:[۱۳] بیشتر «طرح» توسط چهار یا پنج هسته محاسباتی که شامل سه تا معیار یا بیشتر از سه پیاده‌سازی می‌شود.

منابع ویرایش

  1. "HPC Challenge Benchmark". Wikipedia (به انگلیسی). 2018-05-01.
  2. "Benchmark (computing)". Wikipedia (به انگلیسی). 2018-01-23.
  3. "دارپا". ویکی‌پدیا، دانشنامهٔ آزاد. 2018-04-03.
  4. ASC Community (۲۰۱۸). Optimization for the High Performance LINPACK Benchmark. Singapore: Springer Singapore. صص. ۱۸۱–۱۹۱. شابک ۹۷۸۹۸۱۱۰۳۷۳۰۶.
  5. "Basic Linear Algebra Subprograms". Wikipedia (به انگلیسی). 2018-06-08.
  6. ZHANG, Hao; LIN, Wei; ZHOU, Yong-Bin; YE, Xiao-Chun; FAN, Dong-Rui (2009-07-29). "High-Bandwidth Memory Accessing Pipeline of General Purpose Processor". Chinese Journal of Computers. 32 (1): 142–151. doi:10.3724/sp.j.1016.2009.00142. ISSN 0254-4164.
  7. ۷٫۰ ۷٫۱ "Giga-updates per second". Wikipedia (به انگلیسی). 2015-09-27.
  8. "تبدیل سریع فوریه". ویکی‌پدیا، دانشنامهٔ آزاد. 2018-04-13.
  9. "Cooley–Tukey FFT algorithm". Wikipedia (به انگلیسی). 2018-06-02.
  10. "effective bandwidth". SpringerReference. Berlin/Heidelberg: Springer-Verlag.
  11. "ACM/IEEE Supercomputing Conference". Wikipedia (به انگلیسی). 2018-06-04.
  12. معیار طراحی شده‌است که اجازه جایگزینی مجموعه محدودی از توابع را با نسخه‌های به شدت بهینه‌سازی رامی دهد در حالی که باقی مانده یک اجرا "پایه". تغییرات اضافی (اما هنوز هم محدود) تحت رده "بهینه سازی" اجرا می‌شود.
  13. Dongarra, Jack; Kepner, Jeremy (2006). "HPC challenge---The 2006 HPC challenge awards". Proceedings of the 2006 ACM/IEEE conference on Supercomputing - SC '06. New York, New York, USA: ACM Press. doi:10.1145/1188455.1188460. ISBN 0-7695-2700-0.

پیوند به بیرون ویرایش