Loading...

Identification of the Set of Single Nucleotide Variants in Genome Responsible for the Differentiation of Expression of Genes

Khatami, Mahshid | 2021

515 Viewed
  1. Type of Document: M.Sc. Thesis
  2. Language: Farsi
  3. Document No: 54761 (19)
  4. University: Sharif University of Technology
  5. Department: Computer Engineering
  6. Advisor(s): Rabiee, Hamid Reza; Beigi, Hamid
  7. Abstract:
  8. Single nucleotide polymorphs, There are changes caused by a mutation in a nucleotide in the Dena sequence. Mononucleotide polymorphisms are the most common type of genetic variation. Some of these changes have little or no effect on cells, while others cause significant changes in the expression of cell genes that can lead to disease or resistance to certain diseases. Because of the importance of these changes and their effect on cell function, the relationships between these changes are also important. Over the past decade, thousands of single disease-related mononucleotide polymorphisms have been identified in genome-related studies. Studies in this field have shown that the expression of genes is not determined randomly in humans and it is possible to predict their expression with the help of single nucleotide polymorphisms. In this study, the effect of single nucleotide polymorphisms on gene expression was calculated separately. To do this, genomics were categorized into possible modes and then a statistical analysis was performed to determine the significance of this classification. Then, significant single nucleotide polymorphisms were used as input features to different machine learning models to predict the expression of genes. Then, from the interpretation of the taught models, the importance of different mononucleotide polymorphisms was calculated. In the next step, by retraining the models with the help of a certain number of the most important single nucleotide polymorphisms as input features of the model, we observed that if the proposed method for assigning coefficients of importance to the features is selected, the results for predicting gene expression are very different. Teaching models with all the features will not work. As a result, by selecting a small set of features and teaching the model with their help, the accuracy of estimating gene expression will not be greatly reduced. Finally, the proposed method showed better performance compared to previous methods
  9. Keywords:
  10. Single Nucleotide Polymorphism (SNP) ; Statistical Analysis ; Machine Learning ; Gene Expression

 Digital Object List

 Bookmark

  • مقدمه
    • پیش‌نیاز زیستی
      • ژنوم
      • دگره
      • چندشکلی
      • صفت خالص
      • صفت ناخالص
      • ژن‌مایه
      • رخ‌مایه
      • رونویسی و رونوشت
      • رنا
      • رنای پیام‌رسان
      • میانه و بیانه
      • پیرایش رنا
      • پیرایش متغیر
      • بیان ژن
    • فناوری ریزآرایه
      • فناوری ریزآرایه
      • توالی‌یابی رنا
    • تعریف مسئله
    • اهمیت و کاربرد
    • چالش‌ها
    • دستاورد‌های پایان‌نامه
    • ساختار پایان‌نامه
  • پژوهش‌های پیشین
    • تحلیل‌های مبتنی بر شناسایی ژن‌مایه‌های موثر بر میزان بیان ژن‌ها
      • تحلیل‌های مبتنی بر پیاده‌سازی روش‌های یادگیری ماشین بر داده‌های ژن‌مایه
  • راهکار پیشنهادی
    • آماده‌سازی داده‌های اولیه
    • تاثیر ژن‌مایه بر میزان بیان ژن با استفاده از تحلیل‌های آماری‌
    • مدل‌های پیشنهادی
      • مدل اول - رگرسیون خطی
      • مدل دوم - ماشین بردار پشتیبان
      • مدل سوم - جنگل تصادفی
      • مدل چهارم - الاستیک
    • تعیین ضرایب اهمیت برای چندشکلی‌های تک نوکلئوتیدی
    • استفاده از ضرایب اهمیت ژن‌مایه‌ها برای پیش‌بینی میزان بیان ژن
    • تخمین میزان بیان ژن بر اساس ژن‌مایه‌های انتخابی
    • جمع‌بندی
  • نتایج ارزیابی
    • معرفی داده‌های مورد استفاده
    • تحلیل آماری بر روی تاثیر ژن‌مایه بر میزان بیان ژن
    • انتخاب مدل یادگیری ماشین مناسب برای تخمین میزان بیان ژن‌
    • اثبات مناسب بودن بازه انتخابی برای چندشکلی‌های تک نوکلئوتیدی موثر بر ژن
    • بررسی تاثیر جمعیت در پیش‌بینی میزان بیان ژن
    • مقایسه روش‌های مختلف تخصیص ضرایب اهمیت به ژن‌مایه‌ها
    • تخصیص ضرایب اهمیت به ژن‌مایه‌ها به تفکیک جمعیت
    • مقایسه با نتایج کارهای پیشین
    • جمع‌بندی
  • جمع‌بندی و کارهای آتی
  • attachment1.pdf
    • 3959505aa7fe08971adeb807d526e5e3aeaca949899501ad8297fdf9887fc146.pdf
  • attachment4.pdf
    • b9c7d0f98d35aad5bd787dbfc40b0247813b5ea00254ae466228be6fc6737b1d.pdf
...see more