Loading...
- Type of Document: M.Sc. Thesis
- Language: Farsi
- Document No: 56656 (19)
- University: Sharif University of Technology
- Department: Computer Engineering
- Advisor(s): Hossein Khalaj, Babak
- Abstract:
- Polymerase Chain Reaction (PCR) is a laboratory method for amplifying a part of DNA. This method is used in determining the sequence of genes, detecting pathogenic agents in epidemics, creating genetic changes in bacteria, diseases, plants and even animals. Many factors affect the quality of the reaction. Each of these factors can be effective in amplifying the target in DNA. If we can predict the result of PCR using the factors involved in the reaction, it will save a lot of money and time. The aim of this research is to predict the result of PCR amplification using machine learning methods. For this purpose, two methods are proposed: feature-based method and string-based method. In the feature-based method, we must first select the most important features. For this purpose, first we have used some algorithms to sort features by their importance. Then these features were extracted for each dataset and a neural network model was trained on each of these datasets. Also we made 2 other datasets that are combination of these datasets. Then we also trained the neural network model on the combined datasets. The accuracy of the model was 94%, 85%, and 83% for the existing datasets and 84% and 77% for the combined datasets. In the string-based method, with having the primer and template strings, we first found the place where the primer binds to the template. Then we presented a new idea to encode this binding. The binding of each nucleotide pair in this region can be either match or mismatch. For each match or mismatch, one English letter was assigned to it. Then the letters assigned to the nucleotide pairs were put together to form a new string. This procedure can give a specific string to any combination of primer pairs with templates in the dataset. These strings are then fed into an RNN network to process the data. The final accuracy of this model reaches 96% using the presented method for coding bindings
- Keywords:
- Polymerase Chain Reaction (PCR) ; Feature Selection ; Artificial Neural Network ; Amplification Prediction ; Recurrent Neural Networks ; Machine Learning ; Primer
-
محتواي کتاب
- view
- مقدمه
- تعریف مسئله
- اهمیت موضوع
- ساختار پایاننامه
- مفاهیم اولیه
- مقدمه
- واکنش زنجیرهای پلیمراز (PCR)
- دنوتراسیون
- هیبریداسیون یا آنیل شدن
- افزایش طول
- پرایمرها
- عوامل موثر بر طراحی پرایمر
- طول پرایمر
- انحصار
- ساختارهای ثانویه
- دمای ذوب پرایمر
- دمای آنیل شدن
- محتوای GC
- انرژی آزاد گیبس
- نوکلئوتید پایانی ترمینال ۳’ پرایمر PCR
- تاثیر عدم تطابق بین پرایمر و الگو بر طراحی پرایمر
- دیگر عوامل موثر
- انواع روشهای PCR
- Quantitative PCR (qPCR)
- Multiplex PCR
- Methylation Specific PCR (MSP)
- نتیجهگیری
- کارهای پیشین
- مقدمه
- روشهای الگوریتمی
- انتخاب پرایمر بر اساس یک الگوریتم بهینهسازی مبتنی بر یاددهی-یادگیری
- الگوریتم BestPrimer
- روشهای یادگیری ماشین
- مدلسازی تقویت ایمونوگلوبولینها از طریق یادگیری ماشین
- پیشبینی تقویت PCR از توالیهای پرایمر و الگو با استفاده از شبکه عصبی بازگشتی
- یک ابزار یادگیری ماشین برای پیشبینی تقویت qPCR
- بهینهسازی PCR با روشهای یادگیری ماشین
- نتیجهگیری
- پیادهسازیها
- مقدمه
- چالشها
- هزینه انجام آزمایش جدید
- دیتاست برای روش MSP
- کمبود داده
- ناهماهنگی ویژگیهای مورد استفاده در مقالات
- روش مبتنی بر ویژگی
- دادههای مورد استفاده
- تحلیل دادهها
- بررسی اهمیت ویژگیها
- ویژگیهای انتخاب شده و شهود علمی اهمیت این ویژگیها
- استخراج ویژگیها برای رشتههای دیگر دیتاستها
- اضافه کردن ویژگی نوع عدم تطابق
- ساخت دیتاست مشترک با دادهها و ویژگیهای موجود
- آموزش یک مدل شبکه عصبی بر روی دادهها
- پیادهسازی مدل بر روی دیتاستها
- روش مبتنی بر رشته
- ویژگیهای موثر قابل استخراج از اتصال الگو و پرایمر
- انتخاب محل اتصال پرایمر
- محاسبه تغییر انرژی آزاد گیبس
- کد کردن اتصالات بین پرایمر و الگو
- اجرای یک شبکه RNN بر روی دادهها
- نتیجهگیری
- جمعبندی و پیشنهادات
- مقدمه
- مقایسه مدل شبکه عصبی با مدلهای موجود در مقالات پیشین
- مقایسه مدل RNN با مدل موجود در مقاله پیشین
- مقایسه روش مبتنی بر ویژگی با روش مبتنی بر رشته
- جمعبندی
- پیشنهادات
- مراجع
- جدول تطابق
- جدول محاسبه انرژی آزاد گیبس
