Loading...
Identification of the Set of Single Nucleotide Variants in Genome Responsible for the Differentiation of Expression of Genes
Khatami, Mahshid | 2021
515
Viewed
- Type of Document: M.Sc. Thesis
- Language: Farsi
- Document No: 54761 (19)
- University: Sharif University of Technology
- Department: Computer Engineering
- Advisor(s): Rabiee, Hamid Reza; Beigi, Hamid
- Abstract:
- Single nucleotide polymorphs, There are changes caused by a mutation in a nucleotide in the Dena sequence. Mononucleotide polymorphisms are the most common type of genetic variation. Some of these changes have little or no effect on cells, while others cause significant changes in the expression of cell genes that can lead to disease or resistance to certain diseases. Because of the importance of these changes and their effect on cell function, the relationships between these changes are also important. Over the past decade, thousands of single disease-related mononucleotide polymorphisms have been identified in genome-related studies. Studies in this field have shown that the expression of genes is not determined randomly in humans and it is possible to predict their expression with the help of single nucleotide polymorphisms. In this study, the effect of single nucleotide polymorphisms on gene expression was calculated separately. To do this, genomics were categorized into possible modes and then a statistical analysis was performed to determine the significance of this classification. Then, significant single nucleotide polymorphisms were used as input features to different machine learning models to predict the expression of genes. Then, from the interpretation of the taught models, the importance of different mononucleotide polymorphisms was calculated. In the next step, by retraining the models with the help of a certain number of the most important single nucleotide polymorphisms as input features of the model, we observed that if the proposed method for assigning coefficients of importance to the features is selected, the results for predicting gene expression are very different. Teaching models with all the features will not work. As a result, by selecting a small set of features and teaching the model with their help, the accuracy of estimating gene expression will not be greatly reduced. Finally, the proposed method showed better performance compared to previous methods
- Keywords:
- Single Nucleotide Polymorphism (SNP) ; Statistical Analysis ; Machine Learning ; Gene Expression
-
محتواي کتاب
- view
- مقدمه
- پیشنیاز زیستی
- ژنوم
- دگره
- چندشکلی
- صفت خالص
- صفت ناخالص
- ژنمایه
- رخمایه
- رونویسی و رونوشت
- رنا
- رنای پیامرسان
- میانه و بیانه
- پیرایش رنا
- پیرایش متغیر
- بیان ژن
- فناوری ریزآرایه
- فناوری ریزآرایه
- توالییابی رنا
- تعریف مسئله
- اهمیت و کاربرد
- چالشها
- دستاوردهای پایاننامه
- ساختار پایاننامه
- پیشنیاز زیستی
- پژوهشهای پیشین
- تحلیلهای مبتنی بر شناسایی ژنمایههای موثر بر میزان بیان ژنها
- تحلیلهای مبتنی بر پیادهسازی روشهای یادگیری ماشین بر دادههای ژنمایه
- تحلیلهای مبتنی بر شناسایی ژنمایههای موثر بر میزان بیان ژنها
- راهکار پیشنهادی
- آمادهسازی دادههای اولیه
- تاثیر ژنمایه بر میزان بیان ژن با استفاده از تحلیلهای آماری
- مدلهای پیشنهادی
- مدل اول - رگرسیون خطی
- مدل دوم - ماشین بردار پشتیبان
- مدل سوم - جنگل تصادفی
- مدل چهارم - الاستیک
- تعیین ضرایب اهمیت برای چندشکلیهای تک نوکلئوتیدی
- استفاده از ضرایب اهمیت ژنمایهها برای پیشبینی میزان بیان ژن
- تخمین میزان بیان ژن بر اساس ژنمایههای انتخابی
- جمعبندی
- نتایج ارزیابی
- معرفی دادههای مورد استفاده
- تحلیل آماری بر روی تاثیر ژنمایه بر میزان بیان ژن
- انتخاب مدل یادگیری ماشین مناسب برای تخمین میزان بیان ژن
- اثبات مناسب بودن بازه انتخابی برای چندشکلیهای تک نوکلئوتیدی موثر بر ژن
- بررسی تاثیر جمعیت در پیشبینی میزان بیان ژن
- مقایسه روشهای مختلف تخصیص ضرایب اهمیت به ژنمایهها
- تخصیص ضرایب اهمیت به ژنمایهها به تفکیک جمعیت
- مقایسه با نتایج کارهای پیشین
- جمعبندی
- جمعبندی و کارهای آتی
- attachment1.pdf
- 3959505aa7fe08971adeb807d526e5e3aeaca949899501ad8297fdf9887fc146.pdf
- attachment4.pdf
- b9c7d0f98d35aad5bd787dbfc40b0247813b5ea00254ae466228be6fc6737b1d.pdf