Loading...

Cancer Prediction Using cfDNA Methylation Patterns With Deep Learning Approach

Mahdavi, Fatemeh | 2023

86 Viewed
  1. Type of Document: M.Sc. Thesis
  2. Language: Farsi
  3. Document No: 56038 (19)
  4. University: Sharif University of Technology
  5. Department: Computer Engineering
  6. Advisor(s): Soleymani Baghshah, Mahdieh
  7. Abstract:
  8. Liquid biopsy includes information about the progress of the tumor, the effectiveness of the treatment and the possibility of tumor metastasis. This type of biopsy obtains this information by doing diagnosis and enumerating genetic variations in cells and cell-free DNA (cfDNA). Only a small fraction of cfDNA which might be free circulation tumor DNA (ctDNA) fragments, has mutations and is usually identified by epigenetic variations. On the other hand, the use of liquid biopsy has decreased, and tumors in the final stages are often untreatable due to the low accuracy in prediction of cancer. In this research, the aim is to predict cancer using cfDNA methylation patterns. We obtain these patterns using DNase data of the interest cancer. Then, we can find possible positions in the set of genes associated with cfDNA using DNA methylation data. So, we will be able to extract DNA pseudo-patterns without requiring the cancer cells themselves. Then, we proposed an approach in order to predict cancer using cfDNA methylation patterns data. This approach is based on deep learning methods and its purpose is to receive methylation data and learn the patterns within them. We design a convolution neural network with residual connections so that it can predict the probability of having cancer using cfDNA methylation patterns obtained from Gene Expression Omnibus (GEO) experiments using the "fine-tuning" technique. At last, we tried various experiments and methods of implementing of the proposed network using cfDNA methylation data and then we selected the best one
  9. Keywords:
  10. Cell Free Deoxyribonucleic Acid (cfDNA)Biomarker ; Cancer ; Deep Learning ; Convolutional Neural Network ; Epigenetic ; DNA Methylation ; Cancer Prediction

 Digital Object List

 Bookmark

  • چکیده
  • فصل1 مقدمه
    • 1-1 تعریف مسئله
    • 1-2 هدف پژوهش
    • 1-3 ساختار پایان‌نامه
  • فصل2 مقدمات مورد نیاز
    • 2-1 بیوپسی
    • 2-2 اپی‌ژنتیک
      • 2-2-1 متيلاسيون دی‌ان‌ای
        • 2-2-1-1 جزایر سی‌پی‌جی
    • 2-3 سی‌اف-‌دی‌ان‌ای
      • 2-3-1 تغییر در الگوی متیلاسیون ژن‌ها
    • 2-4 تکنیک‌های تشخیص متیلاسیون سی‌اف-‌دی‌ان‌ای
      • 2-4-1 روش‌های مبتنی بر تبدیل بی‌سولفیت
      • 2-4-2 روش‌های مبتنی بر غنی‌سازی رسوب
      • 2-4-3 روش پروفایل 5-هیدروکسی متیل سیتوزین یا hmc5
    • 2-5 اندازه گیری کمیت‌های متیلاسیون سی‌اف-‌دی‌ان‌ای
      • 2-5-1 توالی‌یابی نسل بعدی یا به طور مختصر ان‌جی‌اس
      • 2-5-2 آرایه متیلاسیونی
    • 2-6 دیناز
    • 2-7 ابزار BED
  • فصل3 کارهای مرتبط پیشین
    • 3-1 تکنیک‌های یادگیری ماشین با cfMeDIP-seq
      • 3-1-1 cfMeDIP-seq
      • 3-1-2 جمع‌آوری و پیش‌پردازش داده
      • 3-1-3 پیاده‌سازی داده
      • 3-1-4 جمع‌بندی و نتیجه‌گیری
    • 3-2 رگرسیون لاجستیک
      • 3-2-1 دسته‌بندی سرطانی و غیر سرطانی و محلی‌سازی بافت مبدا
      • 3-2-2 تجزیه و تحلیل در سطح قطعه
      • 3-2-3 مدل‌های منبع محلی
      • 3-2-4 استخراج ویژگی‌ها برای دسته‌بندی
      • 3-2-5 آموزش گروهی دسته‌بند‌های لاجستیک
      • 3-2-6 تعیین آستانه برای تصمیم‌گیری
      • 3-2-7 جمع‌بندی و نتیجه‌گیری
    • 3-3 جنگل تصادفی با استفاده از اس‌موت و t-SNE
      • 3-3-1 جمع‌آوری داده‌
      • 3-3-2 پیش‌پردازش داده و شناسایی نشانگرهای زیستی سرطانی مبتنی بر متیلاسیون
      • 3-3-3 مدل‌های یادگیری ماشین برای دسته‌بندی ‌سرطان‌ها‌
      • 3-3-4 t-SNE و PCA: اس‌موت و مدل تفسیر محلی ناآگاه (LIME)
      • 3-3-5 هستی شناسی ژن یا جی‌او ، تحلیل مسیر و تجسم شبکه
      • 3-3-6 جمع‌بندی و نتیجه‌گیری
    • 3-4 DISMIR
      • 3-4-1 جمع‌آوری و پردازش دادگان
      • 3-4-2 شناسایی دی‌ام‌آر‌های خاص سرطان کبد
      • 3-4-3 پیش‌بینی منبع هر خوانش با یک مدل یادگیری عمیق
      • 3-4-4 تخمین کسر سی‎اف-دی‌ان‌ای مشتق شده از تومور
      • 3-4-5 تجسم هسته‌های مدل یادگیری عمیق با استفاده از PFM
      • 3-4-6 جمع‌بندی و نتیجه‌گیری
    • 3-5 جمع‌بندی نهایی
  • فصل4 روش پیشنهادی
    • 4-1 جمع‌آوری و پیش‌پردازش دادگان
      • 4-1-1 جمع‌آوری
        • 4-1-1-1 دادگان متیلاسیون دی‌ان‌ای
        • 4-1-1-2 دادگان متیلاسیون سی‌اف-دی‌ان‌ای
      • 4-1-2 پیش‌پردازش
        • 4-1-2-1 دادگان متیلاسیون دی‌ان‌ای
        • 4-1-2-2 دادگان متیلاسیون سی‌اف-دی‌ان‌ای
    • 4-2 معماری شبکه یادگیری‌ عمیق پیشنهادی
      • 4-2-1 بخش اول معماری شبکه
        • 4-2-1-1 لایه‌های بلوک 1conv
        • 4-2-1-2 لایه‌های بلوک 1
      • 4-2-2 بخش دوم معماری شبکه
      • 4-2-3 بخش سوم معماری شبکه
      • 4-2-4 بخش چهارم معماری شبکه
      • 4-2-5 خروجی
    • 4-3 جمع‌بندی
  • فصل5 پیاده‌سازی و نتایج
    • 5-1 آماده‌سازی دادگان
      • 5-1-1 متیلاسیون دی‌ان‌ای
      • 5-1-2 متیلاسیون سی‌اف-دی‌ان‌ای
    • 5-2 معیارهای مورداستفاده
      • 5-2-1 ماتریس سردرگمی
      • 5-2-2 منحنی ROC-AUC
    • 5-3 تنظیمات آموزش
      • 5-3-1 رابط برنامه‌نویسی کاربردی
      • 5-3-2 تابع هزینه
      • 5-3-3 نرخ یادگیری
      • 5-3-4 بهینه‌سازی
      • 5-3-5 وزن‎دهی اولیه
      • 5-3-6 شروع آموزش
    • 5-4 آزمایش و نتایج
      • 5-4-1 پیش‌آموزش با دادگان متیلاسیون دی‌ان‌ای
      • 5-4-2 نتایج استفاده از تکنیک تطبیق دقیق
        • 5-4-2-1 روش نرمال‌سازی حداقل-حداکثر
        • 5-4-2-2 روش نرمال‌سازی امتیاز Z
        • 5-4-2-3 بدون نرمال‌سازی
      • 5-4-3 نتایج عدم استفاده از تکنیک تطبیق دقیق
        • 5-4-3-1 روش نرمال‌سازی حداقل-حداکثر
        • 5-4-3-2 روش نرمال‌سازی امتیاز Z
        • 5-4-3-3 بدون نرمال‌سازی
      • 5-4-4 نتایج عدم استفاده از رویکرد پیش‌آموزش
        • 5-4-4-1 روش نرمال‌سازی حداقل-حداکثر
        • 5-4-4-2 روش نرمال‌سازی امتیاز Z
        • 5-4-4-3 بدون نرمال‌سازی
    • 5-5 نتیجه نهایی
    • 5-6 جمع‌بندی
  • نتیجه‌گیری و بررسی کارهای آتی
...see more