Loading...
Cancer Prediction Using cfDNA Methylation Patterns With Deep Learning Approach
Mahdavi, Fatemeh | 2023
86
Viewed
- Type of Document: M.Sc. Thesis
- Language: Farsi
- Document No: 56038 (19)
- University: Sharif University of Technology
- Department: Computer Engineering
- Advisor(s): Soleymani Baghshah, Mahdieh
- Abstract:
- Liquid biopsy includes information about the progress of the tumor, the effectiveness of the treatment and the possibility of tumor metastasis. This type of biopsy obtains this information by doing diagnosis and enumerating genetic variations in cells and cell-free DNA (cfDNA). Only a small fraction of cfDNA which might be free circulation tumor DNA (ctDNA) fragments, has mutations and is usually identified by epigenetic variations. On the other hand, the use of liquid biopsy has decreased, and tumors in the final stages are often untreatable due to the low accuracy in prediction of cancer. In this research, the aim is to predict cancer using cfDNA methylation patterns. We obtain these patterns using DNase data of the interest cancer. Then, we can find possible positions in the set of genes associated with cfDNA using DNA methylation data. So, we will be able to extract DNA pseudo-patterns without requiring the cancer cells themselves. Then, we proposed an approach in order to predict cancer using cfDNA methylation patterns data. This approach is based on deep learning methods and its purpose is to receive methylation data and learn the patterns within them. We design a convolution neural network with residual connections so that it can predict the probability of having cancer using cfDNA methylation patterns obtained from Gene Expression Omnibus (GEO) experiments using the "fine-tuning" technique. At last, we tried various experiments and methods of implementing of the proposed network using cfDNA methylation data and then we selected the best one
- Keywords:
- Cell Free Deoxyribonucleic Acid (cfDNA)Biomarker ; Cancer ; Deep Learning ; Convolutional Neural Network ; Epigenetic ; DNA Methylation ; Cancer Prediction
-
محتواي کتاب
- view
- چکیده
- فصل1 مقدمه
- 1-1 تعریف مسئله
- 1-2 هدف پژوهش
- 1-3 ساختار پایاننامه
- فصل2 مقدمات مورد نیاز
- 2-1 بیوپسی
- 2-2 اپیژنتیک
- 2-2-1 متيلاسيون دیانای
- 2-2-1-1 جزایر سیپیجی
- 2-2-1 متيلاسيون دیانای
- 2-3 سیاف-دیانای
- 2-3-1 تغییر در الگوی متیلاسیون ژنها
- 2-4 تکنیکهای تشخیص متیلاسیون سیاف-دیانای
- 2-4-1 روشهای مبتنی بر تبدیل بیسولفیت
- 2-4-2 روشهای مبتنی بر غنیسازی رسوب
- 2-4-3 روش پروفایل 5-هیدروکسی متیل سیتوزین یا hmc5
- 2-5 اندازه گیری کمیتهای متیلاسیون سیاف-دیانای
- 2-5-1 توالییابی نسل بعدی یا به طور مختصر انجیاس
- 2-5-2 آرایه متیلاسیونی
- 2-6 دیناز
- 2-7 ابزار BED
- فصل3 کارهای مرتبط پیشین
- 3-1 تکنیکهای یادگیری ماشین با cfMeDIP-seq
- 3-1-1 cfMeDIP-seq
- 3-1-2 جمعآوری و پیشپردازش داده
- 3-1-3 پیادهسازی داده
- 3-1-4 جمعبندی و نتیجهگیری
- 3-2 رگرسیون لاجستیک
- 3-2-1 دستهبندی سرطانی و غیر سرطانی و محلیسازی بافت مبدا
- 3-2-2 تجزیه و تحلیل در سطح قطعه
- 3-2-3 مدلهای منبع محلی
- 3-2-4 استخراج ویژگیها برای دستهبندی
- 3-2-5 آموزش گروهی دستهبندهای لاجستیک
- 3-2-6 تعیین آستانه برای تصمیمگیری
- 3-2-7 جمعبندی و نتیجهگیری
- 3-3 جنگل تصادفی با استفاده از اسموت و t-SNE
- 3-3-1 جمعآوری داده
- 3-3-2 پیشپردازش داده و شناسایی نشانگرهای زیستی سرطانی مبتنی بر متیلاسیون
- 3-3-3 مدلهای یادگیری ماشین برای دستهبندی سرطانها
- 3-3-4 t-SNE و PCA: اسموت و مدل تفسیر محلی ناآگاه (LIME)
- 3-3-5 هستی شناسی ژن یا جیاو ، تحلیل مسیر و تجسم شبکه
- 3-3-6 جمعبندی و نتیجهگیری
- 3-4 DISMIR
- 3-4-1 جمعآوری و پردازش دادگان
- 3-4-2 شناسایی دیامآرهای خاص سرطان کبد
- 3-4-3 پیشبینی منبع هر خوانش با یک مدل یادگیری عمیق
- 3-4-4 تخمین کسر سیاف-دیانای مشتق شده از تومور
- 3-4-5 تجسم هستههای مدل یادگیری عمیق با استفاده از PFM
- 3-4-6 جمعبندی و نتیجهگیری
- 3-5 جمعبندی نهایی
- 3-1 تکنیکهای یادگیری ماشین با cfMeDIP-seq
- فصل4 روش پیشنهادی
- 4-1 جمعآوری و پیشپردازش دادگان
- 4-1-1 جمعآوری
- 4-1-1-1 دادگان متیلاسیون دیانای
- 4-1-1-2 دادگان متیلاسیون سیاف-دیانای
- 4-1-2 پیشپردازش
- 4-1-2-1 دادگان متیلاسیون دیانای
- 4-1-2-2 دادگان متیلاسیون سیاف-دیانای
- 4-1-1 جمعآوری
- 4-2 معماری شبکه یادگیری عمیق پیشنهادی
- 4-2-1 بخش اول معماری شبکه
- 4-2-1-1 لایههای بلوک 1conv
- 4-2-1-2 لایههای بلوک 1
- 4-2-2 بخش دوم معماری شبکه
- 4-2-3 بخش سوم معماری شبکه
- 4-2-4 بخش چهارم معماری شبکه
- 4-2-5 خروجی
- 4-2-1 بخش اول معماری شبکه
- 4-3 جمعبندی
- 4-1 جمعآوری و پیشپردازش دادگان
- فصل5 پیادهسازی و نتایج
- 5-1 آمادهسازی دادگان
- 5-1-1 متیلاسیون دیانای
- 5-1-2 متیلاسیون سیاف-دیانای
- 5-2 معیارهای مورداستفاده
- 5-2-1 ماتریس سردرگمی
- 5-2-2 منحنی ROC-AUC
- 5-3 تنظیمات آموزش
- 5-3-1 رابط برنامهنویسی کاربردی
- 5-3-2 تابع هزینه
- 5-3-3 نرخ یادگیری
- 5-3-4 بهینهسازی
- 5-3-5 وزندهی اولیه
- 5-3-6 شروع آموزش
- 5-4 آزمایش و نتایج
- 5-4-1 پیشآموزش با دادگان متیلاسیون دیانای
- 5-4-2 نتایج استفاده از تکنیک تطبیق دقیق
- 5-4-2-1 روش نرمالسازی حداقل-حداکثر
- 5-4-2-2 روش نرمالسازی امتیاز Z
- 5-4-2-3 بدون نرمالسازی
- 5-4-3 نتایج عدم استفاده از تکنیک تطبیق دقیق
- 5-4-3-1 روش نرمالسازی حداقل-حداکثر
- 5-4-3-2 روش نرمالسازی امتیاز Z
- 5-4-3-3 بدون نرمالسازی
- 5-4-4 نتایج عدم استفاده از رویکرد پیشآموزش
- 5-4-4-1 روش نرمالسازی حداقل-حداکثر
- 5-4-4-2 روش نرمالسازی امتیاز Z
- 5-4-4-3 بدون نرمالسازی
- 5-5 نتیجه نهایی
- 5-6 جمعبندی
- 5-1 آمادهسازی دادگان
- نتیجهگیری و بررسی کارهای آتی