Loading...
I/O Workload Characterization in High-Performance Computing (HPC) Applications
Davoudabadi Farahani, Ali | 2024
0
Viewed
- Type of Document: M.Sc. Thesis
- Language: Farsi
- Document No: 57597 (19)
- University: Sharif University of Technology
- Department: Computer Engineering
- Advisor(s): Asadi, Hossein
- Abstract:
- In recent years, the growth of data-intensive applications has caused the storage layer to become the performance bottleneck in High-Performance Computing systems. I/O workload characterization with the help of evaluation of applications pattern provides improving the performance of the storage part of the system. Prior research have addressed a limited range of workloads and evaluated small number of storage layer parameters. In this thesis, for the first time, we provide a comprehensive study of the characterization of real High-Performance Computing applications and evaluate the I/O pattern of a wide range of workloads. After collecting complete results, we proceed to analyze them and finally, present some suggestions for improving the performance of the storage system. The results of this thesis show that finding bottlenecks and fine-tuning machine learning workloads can lead to up to 10 times decrease in runtime and up to 8 times increase in resource utilization. In OpenFOAM, because of the ability to read and write a large volume of data in a short time, utilizing powerful storage subsystems such as Burst Buffer can enhance the performance of the application. Also, in database workloads, using I/O cache accelerates queries with small record sizes
- Keywords:
- High Performance Computing ; Characterization ; Data Storage ; Input/Output Intensive Workloads ; Block Input/Output Layer ; High-Performance Computing Workloads
-
محتواي کتاب
- view
- مقدمه
- پیشزمینه
- سامانه پردازش سریع
- معماری توزیع کارهای پردازش سریع
- سامانه زمانبندی (صف)
- ماشین مجازی پردازش سریع
- لایه محاسباتی
- لایه شبکه
- لایه ذخیرهسازی
- بارهای کاری یادگیری ماشین
- یادگیری عمیق
- شبکههای عصبی پیچشی
- مفاهیم پایه در یادگیری عمیق
- فرایند یادگیری شبکه عصبی
- خط لوله داده
- سایر بارهای کاری پردازش سریع
- بار کاری OpenFOAM
- برنامه محک YCSB
- برنامه محک HammerDB
- ویژگیشناسی بارهای کاری پردازش سریع
- ابزار پایش سامانه پردازش سریع
- ابزار iostat
- ابزار blktrace
- ابزار پایش پردازنده مرکزی و گرافیکی
- پشته ورودی/خروجی سیستمعامل
- لایه سیستمفایل مجازی
- نهانساز صفحه
- لایه بلوک ورودی/خروجی
- جمعبندی
- کارهای مرتبط پیشین
- ویژگیشناسی بارهای کاری ورودی/خروجی
- شتابدهی عملیات یادگیری ماشین
- راه حلهای سختافزاری
- راه حلهای نرمافزاری
- جمع بندی کارهای مرتبط پیشین
- روش پیشنهادی
- روش پایش و ویژگیشناسی بارهای کاری
- بارهای کاری اجرا شده
- بارهای کاری یادگیری ماشین
- بارهای کاری علمی
- برنامههای محک
- محیط اجرای بارهای کاری پردازش سریع
- الگو و اهداف آزمونها
- آزمونهای بارهای کاری یادگیری ماشین
- آزمون بار کاری OpenFOAM
- آزمونهای برنامههای محک پایگاه داده
- ارائه و ارزیابی نتایج
- انگیزه پژوهش
- تاثیر پیکربندی نامناسب دیسکها بر کارایی برنامه
- تاثیر فراخوانیهای متفاوت یک چارچوب بر کارایی برنامه
- بررسی سربار ابزار پایش منابع سامانه بر کارایی برنامه
- بارهای کاری یادگیری ماشین
- تحلیل گلوگاه اجرای مدلهای پیچشی
- الگوی دسترسی ورودی/خروجی مدلهای پیچشی
- تاثیر shuffle بر کارایی، دقت و الگوی دسترسی ورودی/خروجی
- مقایسه روشهای تخصیص ریسمان خط لوله داده در TensorFlow
- تاثیر batch size بر اجرا روی دیسک حالت جامد
- تاثیر batch size بر اجرا روی دیسک سخت
- تحلیل حافظه اصلی در اجرای مدلهای پیچشی
- تاثیر نوع پردازندههای گرافیکی بر کارایی برنامه
- سایر بارهای کاری پردازش سریع
- تحلیل گلوگاه اجرای بار کاری OpenFOAM
- تحلیل گلوگاه اجرای برنامههای محک پایگاه داده
- جمعبندی نتایج آزمونها
- انگیزه پژوهش
- نتیجهگیری و کارهای آتی
- مراجع
- واژهنامه
- کد برنامههای TensorFlow و نحوه اجرا
- کد برنامههای PyTorch و نحوه اجرا
