Sharif Digital Repository / Sharif University of Technology
    • [Zoom In]
    • [Zoom Out]
  • Page 
     of  0
  • [Previous Page]
  • [Next Page]
  • [Fullscreen view]
  • [Close]
 
یکپارچه سازی حافظه ی نهان سطح اول داده و حافظه ی مشترک در پردازنده های گرافیکی
یوسف زاده اصل میاندوآب، احسان Yousefzadeh-Asl-Miandoab, Ehsan

Cataloging brief

یکپارچه سازی حافظه ی نهان سطح اول داده و حافظه ی مشترک در پردازنده های گرافیکی
پدیدآور اصلی :   یوسف زاده اصل میاندوآب، احسان Yousefzadeh-Asl-Miandoab, Ehsan
ناشر :   صنعتی شریف
سال انتشار  :   1397
موضوع ها :   حافظه مشترک Shared Memory حافظه نهان Cache Memory پردازنده های گرافیکی عام منظوره...
شماره راهنما :   ‭19-51241

Find in content

sort by

Bookmark

  • 1 مقدمه (13)
    • 1.1 تعریف مسأله (16)
    • 1.2 راه‌حل پیشنهادی (17)
    • 1.3 ساختار پایان‌نامه (17)
  • 2 پیش‌زمینه (18)
    • 2.1 تاریخچه‌ی پردازنده‌های گرافیکی (18)
    • 2.2 معماری CUDA (19)
    • 2.3 سلسله مراتب ریسمان (20)
    • 2.4 ریزمعماری پردازنده‌های گرافیکی (21)
    • 2.5 خط‌لوله‌ی پردازنده‌ی گرافیکی (24)
    • 2.6 معماری SIMD و SIMT (25)
    • 2.7 سامانه‌ی حافظه در پردازنده‌های گرافیکی (27)
      • 2.7.1 عملیات حافظه‌ای واحد (29)
      • 2.7.2 اصلاح خطا در حافظه (29)
      • 2.7.3 واحد تجمیع درخواست‌های حافظه (30)
    • 2.8 شبکه‌ی روی‌تراشه (30)
    • 2.9 زمان‌بند (31)
    • 2.10 اجرای هم‌زمان کد هسته‌ها (31)
    • 2.11 پردازنده‌ی گرافیکی استفاده شده در این پژوهش (32)
    • 2.12 جمع‌بندی (32)
  • 3 کارهای پیشین (34)
    • 3.1 ساختار یکپارچه‌ی حافظه‌ی مشترک و حافظه‌ی نهان سطح یک در ریزمعماری Fermi (34)
    • 3.2 یکپارچه‌سازی حافظه‌ی نهان، حافظه‌ی چرک‌نویس و پوشه‌ی ثبات (36)
    • 3.3 حافظه‌ی نهان شبیه‌سازی‌شده با کمک پوشه‌ی ثبات (39)
    • 3.4 سایر پژوهش‌های مرتبط (40)
      • 3.4.1 دور زدن حافظه‌ی نهان سطح یک داده در پردازنده‌های گرافیکی (40)
      • 3.4.2 محدود کردن توازی در سطح ریسمان در پردازنده‌های گرافیکی (41)
      • 3.4.3 افراز کردن حافظه‌ی نهان میان چندین بارکاری (42)
      • 3.4.4 قفل‌کردن داده‌ها در حافظه‌ی نهان (42)
    • 3.5 جمع‌بندی (43)
  • 4 روش پیشنهادی (44)
    • 4.1 انگیزه (45)
      • 4.1.1 الگوی بهره‌برداری و دسترسی به حافظه‌ی مشترک (45)
      • 4.1.2 الگوهای مناسب بهره‌برداری از حافظه‌ی مشترک (50)
      • 4.1.3 ظهور دستور shuffle (50)
    • 4.2 معماری پیشنهادی (51)
      • 4.2.1 یکپارچه‌سازی حافظه‌ی نهان سطح یک داده و حافظه‌ی مشترک (51)
      • 4.2.2 قفل کردن داده‌های حافظه‌ی مشترک در حافظه‌ی نهان (51)
    • 4.3 تحلیل سربار روش پیشنهادی (52)
    • 4.4 جمع‌بندی (55)
  • 5 متدولوژی ارزیابی (56)
    • 5.1 سامانه‌ی شبیه‌سازی‌شده (56)
    • 5.2 بارهای کاری (57)
    • 5.3 محیط شبیه‌سازی (60)
    • 5.4 نحوه‌ی پیاده‌سازی سامانه‌ی پیشنهادی در شبیه‌ساز (61)
      • 5.4.1 آزمایشات اولیه با هدف حصول انگیزه‌ی آزمایش (61)
      • 5.4.2 حذف حافظه‌ی مشترک (62)
      • 5.4.3 افراز حافظه‌ی نهان سطح یک (62)
      • 5.4.4 قفل‌کردن داده‌های حافظه‌ی مشترک در حافظه‌ی نهان سطح یک داده (62)
    • 5.5 دسته‌بندی بارهای کاری (62)
    • 5.6 جمع‌بندی (63)
  • 6 نتایج ارزیابی (64)
    • 6.1 کارایی (64)
      • 6.1.1 معماری ارائه‌شده (64)
    • 6.2 نرخ فقدان (65)
    • 6.3 جمع‌بندی (72)
  • 7 نتیجه‌گیری و کارهای آتی (73)
    • 7.1 نتیجه‌گیری (73)
    • 7.2 کارهای آتی (74)
  • آ پردازنده‌های گرافیکی شرکت NVIDIA (75)
    • آ.1 پردازنده‌های گرافیکی ارائه شده توسط شرکت NVIDIA (75)
      • آ.1.1 پردازنده‌های گرافیکی کامپیوترهای رومیزی (75)
      • آ.1.2 پردازنده‌های گرافیکی ایستگاه‌های کاری (76)
      • آ.1.3 پردازنده‌های گرافیکی ادوات محاسباتی سیار (76)
      • آ.1.4 پردازنده‌های گرافیکی ایستگاه‌های کاری سیار (76)
    • آ.2 ریزمعماری‌های ارائه شده توسط شرکت NVIDIA (78)
      • آ.2.1 ریزمعماری Tesla (78)
      • آ.2.2 ریزمعماری Fermi (79)
      • آ.2.3 ریزمعماری Kepler (79)
      • آ.2.4 ریزمعماری Maxwell (80)
      • آ.2.5 ریزمعماری Pascal (80)
      • آ.2.6 ریزمعماری Volta (80)
  • مراجع (81)
  • واژه‌نامه‌ (89)
Loading...