Loading...
I/O Workload Characterization in High-Performance Computing (HPC) Applications
Davoudabadi Farahani, Ali | 2024
0
Viewed
- Type of Document: M.Sc. Thesis
- Language: Farsi
- Document No: 57597 (19)
- University: Sharif University of Technology
- Department: Computer Engineering
- Advisor(s): Asadi, Hossein
- Abstract:
- In recent years, the growth of data-intensive applications has caused the storage layer to become the performance bottleneck in High-Performance Computing systems. I/O workload characterization with the help of evaluation of applications pattern provides improving the performance of the storage part of the system. Prior research have addressed a limited range of workloads and evaluated small number of storage layer parameters. In this thesis, for the first time, we provide a comprehensive study of the characterization of real High-Performance Computing applications and evaluate the I/O pattern of a wide range of workloads. After collecting complete results, we proceed to analyze them and finally, present some suggestions for improving the performance of the storage system. The results of this thesis show that finding bottlenecks and fine-tuning machine learning workloads can lead to up to 10 times decrease in runtime and up to 8 times increase in resource utilization. In OpenFOAM, because of the ability to read and write a large volume of data in a short time, utilizing powerful storage subsystems such as Burst Buffer can enhance the performance of the application. Also, in database workloads, using I/O cache accelerates queries with small record sizes
- Keywords:
- High Performance Computing ; Characterization ; Data Storage ; Input/Output Intensive Workloads ; Block Input/Output Layer ; High-Performance Computing Workloads
-
محتواي کتاب
- view
- مقدمه
- پیشزمینه
- کارهای مرتبط پیشین
- روش پیشنهادی
- ارائه و ارزیابی نتایج
- انگیزه پژوهش
- بارهای کاری یادگیری ماشین
- تحلیل گلوگاه اجرای مدلهای پیچشی
- الگوی دسترسی ورودی/خروجی مدلهای پیچشی
- تاثیر shuffle بر کارایی، دقت و الگوی دسترسی ورودی/خروجی
- مقایسه روشهای تخصیص ریسمان خط لوله داده در TensorFlow
- تاثیر batch size بر اجرا روی دیسک حالت جامد
- تاثیر batch size بر اجرا روی دیسک سخت
- تحلیل حافظه اصلی در اجرای مدلهای پیچشی
- تاثیر نوع پردازندههای گرافیکی بر کارایی برنامه
- سایر بارهای کاری پردازش سریع
- جمعبندی نتایج آزمونها
- نتیجهگیری و کارهای آتی
- مراجع
- واژهنامه
- کد برنامههای TensorFlow و نحوه اجرا
- کد برنامههای PyTorch و نحوه اجرا