Please enable javascript in your browser.
Page
of
0
یکپارچه سازی حافظه ی نهان سطح اول داده و حافظه ی مشترک در پردازنده های گرافیکی
یوسف زاده اصل میاندوآب، احسان Yousefzadeh-Asl-Miandoab, Ehsan
Cataloging brief
یکپارچه سازی حافظه ی نهان سطح اول داده و حافظه ی مشترک در پردازنده های گرافیکی
پدیدآور اصلی :
یوسف زاده اصل میاندوآب، احسان Yousefzadeh-Asl-Miandoab, Ehsan
ناشر :
صنعتی شریف
سال انتشار :
1397
موضوع ها :
حافظه مشترک Shared Memory حافظه نهان Cache Memory پردازنده های گرافیکی عام منظوره...
شماره راهنما :
19-51241
Find in content
sort by
page number
page score
Bookmark
1 مقدمه
(13)
1.1 تعریف مسأله
(16)
1.2 راهحل پیشنهادی
(17)
1.3 ساختار پایاننامه
(17)
2 پیشزمینه
(18)
2.1 تاریخچهی پردازندههای گرافیکی
(18)
2.2 معماری CUDA
(19)
2.3 سلسله مراتب ریسمان
(20)
2.4 ریزمعماری پردازندههای گرافیکی
(21)
2.5 خطلولهی پردازندهی گرافیکی
(24)
2.6 معماری SIMD و SIMT
(25)
2.7 سامانهی حافظه در پردازندههای گرافیکی
(27)
2.7.1 عملیات حافظهای واحد
(29)
2.7.2 اصلاح خطا در حافظه
(29)
2.7.3 واحد تجمیع درخواستهای حافظه
(30)
2.8 شبکهی رویتراشه
(30)
2.9 زمانبند
(31)
2.10 اجرای همزمان کد هستهها
(31)
2.11 پردازندهی گرافیکی استفاده شده در این پژوهش
(32)
2.12 جمعبندی
(32)
3 کارهای پیشین
(34)
3.1 ساختار یکپارچهی حافظهی مشترک و حافظهی نهان سطح یک در ریزمعماری Fermi
(34)
3.2 یکپارچهسازی حافظهی نهان، حافظهی چرکنویس و پوشهی ثبات
(36)
3.3 حافظهی نهان شبیهسازیشده با کمک پوشهی ثبات
(39)
3.4 سایر پژوهشهای مرتبط
(40)
3.4.1 دور زدن حافظهی نهان سطح یک داده در پردازندههای گرافیکی
(40)
3.4.2 محدود کردن توازی در سطح ریسمان در پردازندههای گرافیکی
(41)
3.4.3 افراز کردن حافظهی نهان میان چندین بارکاری
(42)
3.4.4 قفلکردن دادهها در حافظهی نهان
(42)
3.5 جمعبندی
(43)
4 روش پیشنهادی
(44)
4.1 انگیزه
(45)
4.1.1 الگوی بهرهبرداری و دسترسی به حافظهی مشترک
(45)
4.1.2 الگوهای مناسب بهرهبرداری از حافظهی مشترک
(50)
4.1.3 ظهور دستور shuffle
(50)
4.2 معماری پیشنهادی
(51)
4.2.1 یکپارچهسازی حافظهی نهان سطح یک داده و حافظهی مشترک
(51)
4.2.2 قفل کردن دادههای حافظهی مشترک در حافظهی نهان
(51)
4.3 تحلیل سربار روش پیشنهادی
(52)
4.4 جمعبندی
(55)
5 متدولوژی ارزیابی
(56)
5.1 سامانهی شبیهسازیشده
(56)
5.2 بارهای کاری
(57)
5.3 محیط شبیهسازی
(60)
5.4 نحوهی پیادهسازی سامانهی پیشنهادی در شبیهساز
(61)
5.4.1 آزمایشات اولیه با هدف حصول انگیزهی آزمایش
(61)
5.4.2 حذف حافظهی مشترک
(62)
5.4.3 افراز حافظهی نهان سطح یک
(62)
5.4.4 قفلکردن دادههای حافظهی مشترک در حافظهی نهان سطح یک داده
(62)
5.5 دستهبندی بارهای کاری
(62)
5.6 جمعبندی
(63)
6 نتایج ارزیابی
(64)
6.1 کارایی
(64)
6.1.1 معماری ارائهشده
(64)
6.2 نرخ فقدان
(65)
6.3 جمعبندی
(72)
7 نتیجهگیری و کارهای آتی
(73)
7.1 نتیجهگیری
(73)
7.2 کارهای آتی
(74)
آ پردازندههای گرافیکی شرکت NVIDIA
(75)
آ.1 پردازندههای گرافیکی ارائه شده توسط شرکت NVIDIA
(75)
آ.1.1 پردازندههای گرافیکی کامپیوترهای رومیزی
(75)
آ.1.2 پردازندههای گرافیکی ایستگاههای کاری
(76)
آ.1.3 پردازندههای گرافیکی ادوات محاسباتی سیار
(76)
آ.1.4 پردازندههای گرافیکی ایستگاههای کاری سیار
(76)
آ.2 ریزمعماریهای ارائه شده توسط شرکت NVIDIA
(78)
آ.2.1 ریزمعماری Tesla
(78)
آ.2.2 ریزمعماری Fermi
(79)
آ.2.3 ریزمعماری Kepler
(79)
آ.2.4 ریزمعماری Maxwell
(80)
آ.2.5 ریزمعماری Pascal
(80)
آ.2.6 ریزمعماری Volta
(80)
مراجع
(81)
واژهنامه
(89)