Sharif Digital Repository / Sharif University of Technology
    • [Zoom In]
    • [Zoom Out]
  • Page 
     of  0
  • [Previous Page]
  • [Next Page]
  • [Fullscreen view]
  • [Close]
 
ارائه ابزار پیش‌ بینی ساختار سوم پروتئین‌ ها با استفاده از شبکه‌ های عصبی و کدینگ ساختار اول پروتئین مبتنی بر GPU
فریدون، محمد امین Fereidoon, Mohammad Amin

Cataloging brief

ارائه ابزار پیش‌ بینی ساختار سوم پروتئین‌ ها با استفاده از شبکه‌ های عصبی و کدینگ ساختار اول پروتئین مبتنی بر GPU
پدیدآور اصلی :   فریدون، محمد امین Fereidoon, Mohammad Amin
ناشر :   صنعتی شریف
سال انتشار  :   1403
موضوع ها :   ساختار پروتئین Protein Structure یادگیری عمیق Deep Learning مدل آلفافولد Alphafold Model...
شماره راهنما :   ‭19-57564

Find in content

sort by

Bookmark

  • چکیده (5)
  • فهرست جدول‌ها (10)
  • فهرست تصویرها (11)
  • فهرست نمودارها (12)
  • فصل1 مقدمه (14)
    • 1-1 تعریف مسئله (14)
    • 1-2 اهمیت موضوع (17)
    • 1-3 مدل‌سازی ساختار پروتئین با استفاده از روش‌های محاسباتی (18)
    • 1-4 ارزیابی CASP (20)
    • 1-5 چالش‌ها و اهداف پژوهش (21)
    • 1-6 ساختار پایان‌نامه (23)
  • فصل2 کارهای پیشین (24)
    • 2-1 مدل‌سازی مبتنی بر الگو (24)
      • 2-1-1 مراحل مدل‌سازی مبتنی بر الگو (24)
        • 2-1-1-1 شناسایی الگوها (24)
        • 2-1-1-2 هم‌ترازی توالی‌ها (25)
        • 2-1-1-3 ساخت چارچوب اولیه (25)
        • 2-1-1-4 پالایش ساختار نهایی (25)
      • 2-1-2 دسته‌بندی روش‌های مدل‌سازی مبتنی بر الگو (26)
        • 2-1-2-1 مدل‌سازی مبتنی بر همولوژی (26)
        • 2-1-2-2 نخ‌سازی (26)
      • 2-1-3 نمونه‌های موفق مدل‌سازی مبتنی بر الگو (26)
        • 2-1-3-1 ابزار I-TASSER (27)
        • 2-1-3-2 ابزار RosettaCM (27)
    • 2-2 مدل‌سازی بدون الگو (27)
      • 2-2-1 مراحل مدل‌سازی بدون الگو (28)
        • 2-2-1-1 جستجوی فضایی (28)
        • 2-2-1-2 الگوریتم‌های ژنتیک (28)
        • 2-2-1-3 شبیه‌سازی‌های مونت‌کارلو (28)
        • 2-2-1-4 استفاده از توابع انرژی (29)
    • 2-3 پیش‌بینی ساختار پروتئین بر اساس نقشه تماس (29)
      • 2-3-1 مراحل پیش‌بینی ساختار پروتئین بر اساس نقشه تماس (30)
        • 2-3-1-1 پیش‌بینی تماس‌های پروتئینی (30)
        • 2-3-1-2 تولید نقشه تماس (30)
        • 2-3-1-3 ساخت مدل سه‌بعدی (30)
        • 2-3-1-4 پالایش مدل (30)
      • 2-3-2 ابزارها و روش‌های پیش‌بینی ساختار بر اساس نقشه تماس (31)
        • 2-3-2-1 ابزار CONFOLD (31)
        • 2-3-2-2 ابزار trRosetta (32)
    • 2-4 پیش‌بینی ساختار پروتئین بر اساس پیش‌بینی مبتنی بر فاصله (33)
    • 2-5 پیش‌بینی ساختار پروتئین به‌صورت انتها به انتها (34)
      • 2-5-1 آلفافولد2 (35)
        • 2-5-1-1 پردازش توالی ورودی در آلفافولد2 (36)
        • 2-5-1-2 معماری مدل آلفافولد2 (36)
        • 2-5-1-3 نتایج آلفافولد2 (37)
      • 2-5-2 پارافولد (38)
        • 2-5-2-1 نتایج پارافولد (39)
      • 2-5-3 کولب‌فولد (40)
        • 2-5-3-1 نتایج کولب‌فولد (42)
    • 2-6 پیش‌بینی ساختار پروتئین مبتنی بر مدل‌های زبانی پروتئین (43)
      • 2-6-1 مبانی پیش‌بینی مبتنی بر مدل‌های زبانی پروتئین (43)
      • 2-6-2 روش‌های برجسته پیش‌بینی مبتنی بر مدل‌ زبانی پروتئین (43)
      • 2-6-3 روش ESMFold (44)
        • 2-6-3-1 نتایج ESM-2 (46)
      • 2-6-4 چالش‌ها و ظرفیت‌های آینده (47)
    • 2-7 پیش‌بینی ساختار پروتئین‌های چند دامنه‌ای (48)
      • 2-7-1 اهمیت و چالش‌ها (49)
      • 2-7-2 رویکردهای رایج برای پیش‌بینی پروتئین‌های چند دامنه‌ای (49)
      • 2-7-3 محدودیت‌های کلیدی (50)
    • 2-8 جمع‌بندی کارهای پیشین (51)
  • فصل3 روش پیشنهادی (54)
    • 3-1 ساختار کلی روش پیشنهادی (55)
      • 3-1-1 بخش اول: استفاده از CPU (55)
      • 3-1-2 بخش دوم: استفاده از GPU (58)
    • 3-2 معرفی کتابخانة JAX (58)
    • 3-3 اجرای بخش ساخت هم‌ترازی توالی چندگانه و استنتاج به‌صورت مستقل از هم (59)
      • 3-3-1 افزایش کارایی محاسباتی و صرفه‌جویی در زمان (59)
      • 3-3-2 انعطاف‌پذیری بیشتر در استفاده از ابزارهای مختلف (60)
      • 3-3-3 مدیریت بهتر منابع محاسباتی و جلوگیری از تداخل‌های عملکردی (60)
      • 3-3-4 افزایش قابلیت اطمینان و پایداری فرایند پیش‌بینی (60)
    • 3-4 استفاده از MMseqs2 برای یافتن هم‌ترازی‌های توالی چندگانه (61)
      • 3-4-1 سرعت بالا و کارایی پردازشی (61)
      • 3-4-2 مقیاس‌پذیری بالا (61)
      • 3-4-3 دقت مناسب در هم‌ترازی توالی‌ها (62)
      • 3-4-4 کاهش مصرف منابع محاسباتی (62)
    • 3-5 بهینه‌سازی استفاده از RAM در پارافولد (62)
      • 3-5-1 مرتب‌سازی پروتئین‌ها بر اساس طول (63)
      • 3-5-2 مدیریت پویا و پاک‌سازی مدل‌های کامپایل‌شده (63)
      • 3-5-3 کاهش خطر بروز خطای OOM (63)
    • 3-6 پیاده‌سازی JAXalpha بر بستر گوگل‌ کولب به‌جای HPC (64)
      • 3-6-1 دسترسی آسان و رایگان (64)
      • 3-6-2 سهولت در پیاده‌سازی و استفاده (65)
      • 3-6-3 کاهش هزینه‌ها و مدیریت منابع (65)
  • فصل4 پیاده‌سازی و نتایج (66)
    • 4-1 معیارهای ارزیابی استفاده شده (66)
      • 4-1-1 معیار RMSD (66)
        • 4-1-1-1 تعریف و رابطة RMSD (67)
        • 4-1-1-2 اهمیت RMSD در ارزیابی ساختار سوم پروتئین‌ها (67)
        • 4-1-1-3 مزایا و محدودیت‌های RMSD (68)
      • 4-1-2 معیار TM-score (68)
        • 4-1-2-1 تعریف TM-score (69)
        • 4-1-2-2 اهمیت TM-score در ارزیابی ساختار سوم پروتئین‌ها (69)
        • 4-1-2-3 محاسبه TM-score (69)
        • 4-1-2-4 مزایا و محدودیت‌های TM-score (70)
      • 4-1-3 معیار GDT-TS Score (71)
        • 4-1-3-1 اهمیت GDT-TS Score در ارزیابی ساختار سوم پروتئین‌ها (71)
        • 4-1-3-2 مزایا و محدودیت‌های GDT-TS Score (72)
      • 4-1-4 معیار شباهت ساختار ثانویه (72)
        • 4-1-4-1 روش محاسبه شباهت ساختار ثانویه (73)
        • 4-1-4-2 اهمیت شباهت ساختار ثانویه در ارزیابی ساختار پروتئین‌ها (73)
      • 4-1-5 معیار تفاوت میانگین در ماتریس‌های فاصله (74)
        • 4-1-5-1 نحوه محاسبة تفاوت میانگین در ماتریس‌های فاصله (74)
        • 4-1-5-2 اهمیت معیار تفاوت میانگین در ماتریس‌های فاصله (74)
    • 4-2 مجموعه‌داده‌های استفاده شده برای ارزیابی (75)
    • 4-3 مقایسه زمان ساخت فایل feature.pkl توسط دو روش آلفافولد و MMseqs2 (76)
    • 4-4 مقایسه زمان اجرای فرایند استنتاج با اجرای بهینه‌سازی کامپایل JAX و بدون اجرای بهینه‌سازی کامپایل ‌ JAX (79)
      • 4-4-1 بررسی زمان اجرای فرایند استنتاج در مجموعه‌داده اول (79)
      • 4-4-2 بررسی زمان اجرای فرایند استنتاج در مجموعه‌داده دوم (84)
    • 4-5 مقایسه دقت مدل‌های پیش‌بینی شده نسبت به ساختار مرجع (89)
  • فصل5 جمع‌بندی و نتیجه‌گیری (93)
    • 5-1 کارهای آتی (94)
  • منابع یا مراجع (96)
Loading...