I/O Workload Characterization in High-Performance Computing (HPC) Applications

Davoudabadi Farahani, Ali; Asadi, Hossein

Please enable javascript in your browser.

I/O Workload Characterization in High-Performance Computing (HPC) Applications

Davoudabadi Farahani, Ali | 2024

0 Viewed

Type of Document: M.Sc. Thesis
Language: Farsi
Document No: 57597 (19)
University: Sharif University of Technology
Department: Computer Engineering
Advisor(s): Asadi, Hossein
Abstract:
In recent years, the growth of data-intensive applications has caused the storage layer to become the performance bottleneck in High-Performance Computing systems. I/O workload characterization with the help of evaluation of applications pattern provides improving the performance of the storage part of the system. Prior research have addressed a limited range of workloads and evaluated small number of storage layer parameters. In this thesis, for the first time, we provide a comprehensive study of the characterization of real High-Performance Computing applications and evaluate the I/O pattern of a wide range of workloads. After collecting complete results, we proceed to analyze them and finally, present some suggestions for improving the performance of the storage system. The results of this thesis show that finding bottlenecks and fine-tuning machine learning workloads can lead to up to 10 times decrease in runtime and up to 8 times increase in resource utilization. In OpenFOAM, because of the ability to read and write a large volume of data in a short time, utilizing powerful storage subsystems such as Burst Buffer can enhance the performance of the application. Also, in database workloads, using I/O cache accelerates queries with small record sizes
Keywords:
High Performance Computing ; Characterization ; Data Storage ; Input/Output Intensive Workloads ; Block Input/Output Layer ; High-Performance Computing Workloads

Digital Object List

محتواي کتاب
view

Bookmark

مقدمه
پیش‏زمینه
- سامانه پردازش سریع
- معماری توزیع کارهای پردازش سریع
  - سامانه زمانبندی (صف)
  - ماشین مجازی پردازش سریع
  - لایه محاسباتی
  - لایه شبکه
  - لایه ذخیره‏سازی
- بارهای کاری یادگیری ماشین
  - یادگیری عمیق
  - شبکه‏های عصبی پیچشی
  - مفاهیم پایه در یادگیری عمیق
  - فرایند یادگیری شبکه عصبی
  - خط لوله داده
- سایر بارهای کاری پردازش سریع
  - بار کاری OpenFOAM
  - برنامه محک YCSB
  - برنامه محک HammerDB
- ویژگی‏شناسی بارهای کاری پردازش سریع
- ابزار پایش سامانه پردازش سریع
  - ابزار iostat
  - ابزار blktrace
  - ابزار پایش پردازنده مرکزی و گرافیکی
- پشته ورودی/خروجی سیستم‏عامل
  - لایه سیستم‏فایل مجازی
  - نهان‏ساز صفحه
  - لایه بلوک ورودی/خروجی
  - جمع‌بندی
کارهای مرتبط پیشین
- ویژگی‏‌شناسی بارهای کاری ورودی/خروجی
- شتاب‏دهی عملیات یادگیری ماشین
  - راه حل‏های سخت‏افزاری
  - راه حل‏های نرم‏افزاری
- جمع بندی کارهای مرتبط پیشین
روش پیشنهادی
- روش پایش و ویژگی‏شناسی بارهای کاری
- بارهای کاری اجرا شده
  - بارهای کاری یادگیری ماشین
  - بارهای کاری علمی
  - برنامه‏های محک
- محیط اجرای بارهای کاری پردازش سریع
- الگو و اهداف آزمون‏ها
  - آزمون‌های بارهای کاری یادگیری ماشین
  - آزمون بار کاری OpenFOAM
  - آزمون‌های برنامه‌های محک پایگاه داده
ارائه و ارزیابی نتایج
- انگیزه پژوهش
  - تاثیر پیکربندی نامناسب دیسک‏ها بر کارایی برنامه
  - تاثیر فراخوانی‏های متفاوت یک چارچوب بر کارایی برنامه
  - بررسی سربار ابزار پایش منابع سامانه بر کارایی برنامه
- بارهای کاری یادگیری ماشین
  - تحلیل گلوگاه اجرای مدل‏های پیچشی
  - الگوی دسترسی ورودی/خروجی مدل‏های پیچشی
  - تاثیر shuffle بر کارایی، دقت و الگوی دسترسی ورودی/خروجی
  - مقایسه روش‏های تخصیص ریسمان خط لوله داده در TensorFlow
  - تاثیر batch size بر اجرا روی دیسک حالت جامد
  - تاثیر batch size بر اجرا روی دیسک سخت
  - تحلیل حافظه اصلی در اجرای مدل‏های پیچشی
  - تاثیر نوع پردازنده‌های گرافیکی بر کارایی برنامه
- سایر بارهای کاری پردازش سریع
  - تحلیل گلوگاه اجرای بار کاری OpenFOAM
  - تحلیل گلوگاه اجرای برنامه‏های محک پایگاه داده
- جمع‌بندی نتایج آزمون‌ها
نتیجه‌گیری و کارهای آتی
مراجع
واژه‌نامه
کد برنامه‌های TensorFlow و نحوه اجرا
کد برنامه‌های PyTorch و نحوه اجرا

Friend's email
Your name
Your email
enter code