Please enable javascript in your browser.
Page
of
0
ارائه ابزار پیش بینی ساختار سوم پروتئین ها با استفاده از شبکه های عصبی و کدینگ ساختار اول پروتئین مبتنی بر GPU
فریدون، محمد امین Fereidoon, Mohammad Amin
Cataloging brief
ارائه ابزار پیش بینی ساختار سوم پروتئین ها با استفاده از شبکه های عصبی و کدینگ ساختار اول پروتئین مبتنی بر GPU
پدیدآور اصلی :
فریدون، محمد امین Fereidoon, Mohammad Amin
ناشر :
صنعتی شریف
سال انتشار :
1403
موضوع ها :
ساختار پروتئین Protein Structure یادگیری عمیق Deep Learning مدل آلفافولد Alphafold Model...
شماره راهنما :
19-57564
Find in content
sort by
page number
page score
Bookmark
چکیده
(5)
فهرست جدولها
(10)
فهرست تصویرها
(11)
فهرست نمودارها
(12)
فصل1 مقدمه
(14)
1-1 تعریف مسئله
(14)
1-2 اهمیت موضوع
(17)
1-3 مدلسازی ساختار پروتئین با استفاده از روشهای محاسباتی
(18)
1-4 ارزیابی CASP
(20)
1-5 چالشها و اهداف پژوهش
(21)
1-6 ساختار پایاننامه
(23)
فصل2 کارهای پیشین
(24)
2-1 مدلسازی مبتنی بر الگو
(24)
2-1-1 مراحل مدلسازی مبتنی بر الگو
(24)
2-1-1-1 شناسایی الگوها
(24)
2-1-1-2 همترازی توالیها
(25)
2-1-1-3 ساخت چارچوب اولیه
(25)
2-1-1-4 پالایش ساختار نهایی
(25)
2-1-2 دستهبندی روشهای مدلسازی مبتنی بر الگو
(26)
2-1-2-1 مدلسازی مبتنی بر همولوژی
(26)
2-1-2-2 نخسازی
(26)
2-1-3 نمونههای موفق مدلسازی مبتنی بر الگو
(26)
2-1-3-1 ابزار I-TASSER
(27)
2-1-3-2 ابزار RosettaCM
(27)
2-2 مدلسازی بدون الگو
(27)
2-2-1 مراحل مدلسازی بدون الگو
(28)
2-2-1-1 جستجوی فضایی
(28)
2-2-1-2 الگوریتمهای ژنتیک
(28)
2-2-1-3 شبیهسازیهای مونتکارلو
(28)
2-2-1-4 استفاده از توابع انرژی
(29)
2-3 پیشبینی ساختار پروتئین بر اساس نقشه تماس
(29)
2-3-1 مراحل پیشبینی ساختار پروتئین بر اساس نقشه تماس
(30)
2-3-1-1 پیشبینی تماسهای پروتئینی
(30)
2-3-1-2 تولید نقشه تماس
(30)
2-3-1-3 ساخت مدل سهبعدی
(30)
2-3-1-4 پالایش مدل
(30)
2-3-2 ابزارها و روشهای پیشبینی ساختار بر اساس نقشه تماس
(31)
2-3-2-1 ابزار CONFOLD
(31)
2-3-2-2 ابزار trRosetta
(32)
2-4 پیشبینی ساختار پروتئین بر اساس پیشبینی مبتنی بر فاصله
(33)
2-5 پیشبینی ساختار پروتئین بهصورت انتها به انتها
(34)
2-5-1 آلفافولد2
(35)
2-5-1-1 پردازش توالی ورودی در آلفافولد2
(36)
2-5-1-2 معماری مدل آلفافولد2
(36)
2-5-1-3 نتایج آلفافولد2
(37)
2-5-2 پارافولد
(38)
2-5-2-1 نتایج پارافولد
(39)
2-5-3 کولبفولد
(40)
2-5-3-1 نتایج کولبفولد
(42)
2-6 پیشبینی ساختار پروتئین مبتنی بر مدلهای زبانی پروتئین
(43)
2-6-1 مبانی پیشبینی مبتنی بر مدلهای زبانی پروتئین
(43)
2-6-2 روشهای برجسته پیشبینی مبتنی بر مدل زبانی پروتئین
(43)
2-6-3 روش ESMFold
(44)
2-6-3-1 نتایج ESM-2
(46)
2-6-4 چالشها و ظرفیتهای آینده
(47)
2-7 پیشبینی ساختار پروتئینهای چند دامنهای
(48)
2-7-1 اهمیت و چالشها
(49)
2-7-2 رویکردهای رایج برای پیشبینی پروتئینهای چند دامنهای
(49)
2-7-3 محدودیتهای کلیدی
(50)
2-8 جمعبندی کارهای پیشین
(51)
فصل3 روش پیشنهادی
(54)
3-1 ساختار کلی روش پیشنهادی
(55)
3-1-1 بخش اول: استفاده از CPU
(55)
3-1-2 بخش دوم: استفاده از GPU
(58)
3-2 معرفی کتابخانة JAX
(58)
3-3 اجرای بخش ساخت همترازی توالی چندگانه و استنتاج بهصورت مستقل از هم
(59)
3-3-1 افزایش کارایی محاسباتی و صرفهجویی در زمان
(59)
3-3-2 انعطافپذیری بیشتر در استفاده از ابزارهای مختلف
(60)
3-3-3 مدیریت بهتر منابع محاسباتی و جلوگیری از تداخلهای عملکردی
(60)
3-3-4 افزایش قابلیت اطمینان و پایداری فرایند پیشبینی
(60)
3-4 استفاده از MMseqs2 برای یافتن همترازیهای توالی چندگانه
(61)
3-4-1 سرعت بالا و کارایی پردازشی
(61)
3-4-2 مقیاسپذیری بالا
(61)
3-4-3 دقت مناسب در همترازی توالیها
(62)
3-4-4 کاهش مصرف منابع محاسباتی
(62)
3-5 بهینهسازی استفاده از RAM در پارافولد
(62)
3-5-1 مرتبسازی پروتئینها بر اساس طول
(63)
3-5-2 مدیریت پویا و پاکسازی مدلهای کامپایلشده
(63)
3-5-3 کاهش خطر بروز خطای OOM
(63)
3-6 پیادهسازی JAXalpha بر بستر گوگل کولب بهجای HPC
(64)
3-6-1 دسترسی آسان و رایگان
(64)
3-6-2 سهولت در پیادهسازی و استفاده
(65)
3-6-3 کاهش هزینهها و مدیریت منابع
(65)
فصل4 پیادهسازی و نتایج
(66)
4-1 معیارهای ارزیابی استفاده شده
(66)
4-1-1 معیار RMSD
(66)
4-1-1-1 تعریف و رابطة RMSD
(67)
4-1-1-2 اهمیت RMSD در ارزیابی ساختار سوم پروتئینها
(67)
4-1-1-3 مزایا و محدودیتهای RMSD
(68)
4-1-2 معیار TM-score
(68)
4-1-2-1 تعریف TM-score
(69)
4-1-2-2 اهمیت TM-score در ارزیابی ساختار سوم پروتئینها
(69)
4-1-2-3 محاسبه TM-score
(69)
4-1-2-4 مزایا و محدودیتهای TM-score
(70)
4-1-3 معیار GDT-TS Score
(71)
4-1-3-1 اهمیت GDT-TS Score در ارزیابی ساختار سوم پروتئینها
(71)
4-1-3-2 مزایا و محدودیتهای GDT-TS Score
(72)
4-1-4 معیار شباهت ساختار ثانویه
(72)
4-1-4-1 روش محاسبه شباهت ساختار ثانویه
(73)
4-1-4-2 اهمیت شباهت ساختار ثانویه در ارزیابی ساختار پروتئینها
(73)
4-1-5 معیار تفاوت میانگین در ماتریسهای فاصله
(74)
4-1-5-1 نحوه محاسبة تفاوت میانگین در ماتریسهای فاصله
(74)
4-1-5-2 اهمیت معیار تفاوت میانگین در ماتریسهای فاصله
(74)
4-2 مجموعهدادههای استفاده شده برای ارزیابی
(75)
4-3 مقایسه زمان ساخت فایل feature.pkl توسط دو روش آلفافولد و MMseqs2
(76)
4-4 مقایسه زمان اجرای فرایند استنتاج با اجرای بهینهسازی کامپایل JAX و بدون اجرای بهینهسازی کامپایل JAX
(79)
4-4-1 بررسی زمان اجرای فرایند استنتاج در مجموعهداده اول
(79)
4-4-2 بررسی زمان اجرای فرایند استنتاج در مجموعهداده دوم
(84)
4-5 مقایسه دقت مدلهای پیشبینی شده نسبت به ساختار مرجع
(89)
فصل5 جمعبندی و نتیجهگیری
(93)
5-1 کارهای آتی
(94)
منابع یا مراجع
(96)