Loading...

Enhancing and Normalizing DNA Microarray Data Using RNA-seq Dataset

Khajeh, Tina | 2017

1629 Viewed
  1. Type of Document: M.Sc. Thesis
  2. Language: Farsi
  3. Document No: 49426 (19)
  4. University: Sharif University of Technology
  5. Department: Computer Engineering
  6. Advisor(s): Motahari, Abolfazl; Beigy, Hamid
  7. Abstract:
  8. Nowadays, many progresses in biology and medicine such as diagnosis of diseases and drug discoveries depend heavily on analyzing biological datasets collected from advanced machines. DNA Microarrays are amongst such machines applicable in measuring the expressions levels of thousand of genes and genotyping of a set of single nucleotide polymorphic sites to name a few. Compared to the more advanced Next Generation Sequencing (NGS) technology, the microarray platform produces lower quality of datasets. However, there has been tones of efforts to produce, process, and curate datasets from microarrays based on well designed protocols for sample preparation, hybridization, image processing, and statical learning algorithms. Hence, it is motivating to enhance and normalize microarray datasets based on new and more accurate observations from NGS technologies to make it more reliable in research as well as practice. In this research, we propose a new approach to enhance microarray data with the use of equivalent RNA-Seq gene expression data as a reference, which is a more accurate method for gene expression assessment. We first make the independence assumption between genes.Then we estimate the probability distribution of RNA-Seq data with normal distribution as a function of microarray gene expression. Parameters of normal distribution which are functions of microarray data can be learned using linear regression method. To estimate value of RNA-Seq method from microarray gene expression, we used the new learned model. The proposed method is successful in predicting absolute values and fold change detection of gene expression. But it is not successful in the case of differentially expressed genes detection
  9. Keywords:
  10. Microarray ; Normalization ; RNA Sequencing ; Enhancing

 Digital Object List

 Bookmark

  • فهرست شکل‌ها
  • فهرست جدول‌ها
  • مقدمه
    • تعریف مسئله
    • اهمیت
    • چالش‌ها
    • ‌ساختار پایان‌نامه
  • مفاهیم‌ زیست‌شناسی و روش‌های اندازه‌گیری بیان ژن
    • مفاهیم زیست‌شناسی
      • کرومزوم
      • مولکول DNA
      • ژن
      • مولکول mRNA
      • بیان ژن
      • پروتئين
    • روش‌های اندازه‌گیری بیان ژن
      • روش q-PCR
      • تکنولوژی میکروآرایه
      • روش توالی‌یابی RNA
      • مقایسه روش‌های اندازه‌گیری بیان ژن
  • مروری بر پژوهش‌های پیشین
    • روش‌های نرمال‌سازی داده‌های میکروآرایه
    • پژوهشهاي پيشين مرتبط با ايده حل مسئله
    • جمع‌بندی
  • روش پژوهش
    • اهمیت پیش‌پردازش‌ داده‌ها
    • راهکار‌های‌ پیشنهادی
      • راهکار پیشنهادی مبتنی بر فرضیه اول
      • راهکار پیشنهادی مبتنی بر فرضیه دوم
    • جمع‌بندی
  • شبیه‌سازی و نتایج
    • معرفی ‌دادگان
    • پیش پردازش دادگان
      • پیش پردازش دادگان میکروآرایه
      • پیش پردازش داده‌های توالی‌یابی RNA
    • معرفی معیار‌های ارزیابی
      • همبستگی پیرسون
      • میانگین مربعات خطا
      • ژن‌های با بیان متفاوت
    • پیاده‌سازی روش‌های پیشنهادی
      • روش پیشنهادی متناسب با فرضیه اول
      • روش پیشنهادی متناسب با فرضیه دوم
      • نتایج ارزیابی‌
    • ‌جمع‌بندی
  • جمع‌بندی و کارهای آتی
    • دستاورد‌ها
    • کارهای آینده
  • مراجع
  • واژه‌نامه انگلیسی به فارسی
  • واژه‌نامه فارسی به انگلیسی
...see more