Loading...

Identifying Core Genes in Estimation of Missing Gene Expressions

Darvish Shafighi, Shadi | 2017

1261 Viewed
  1. Type of Document: M.Sc. Thesis
  2. Language: Farsi
  3. Document No: 50715 (19)
  4. University: Sharif University of Technology
  5. Department: Computer Engineering
  6. Advisor(s): Motahari, Abolfazl
  7. Abstract:
  8. Characterizing cellular states in response to various disease conditions is an important issue which is addressed by different methods such as Large-scale gene expression profiling. One of the most important challenges in front of bioinformaticians is the loss of data because expression profiling is still very expensive. It is understood that profiling a group of selected genes could be enough for understanding all of the gene expression profile.In this research, we propose a fast method for estimation of the missing values inlow-rank matrices. We consider the highly correlated expression profiles as a low-rank matrix. Then, we used this new method in a proposed algorithm which will select the landmark genes and also estimate the target genes iteratively. The algorithm tries to enhance the representation of the landmark genes in each iteration.The proposed algorithm was successful compared to the related works. It could help in the process of lowering the expenses of the Large-scale gene-expression profiling. The improvement of the estimation error was 3.2 percent compare to the best method which is D-GEX.Also we capture the errors which are significant in both methods and find that we could reduce the significant errors 21 percent in comparison with D-GEX
  9. Keywords:
  10. Estimation ; Gene Expression Data ; Bioloical Data ; Retrofiting ; Landmark Genes ; Target Genes

 Digital Object List

 Bookmark

  • فهرست شکل‌ها
  • فهرست جدول‌ها
  • مقدمه
    • تعریف مسئله
    • اهمیت
    • چالش‌ها
    • ‌ساختار پایان‌نامه
  • مفاهیم‌ زیست‌شناسی و یادگیری ماشین
    • مفاهیم زیست‌شناسی
      • مولکول DNA
      • ژن
      • تولید پروتئین
      • بیان ژن
    • یادگیری ماشین
      • رگرسیون
      • تجزیه‌ی مقدار تکین
      • شبکه ‌عصبی
      • دسته‌بندی k-means
      • روش حریصانه و بدون ناظر برای انتخاب زیرمجموعه‌ای از ستون‌ها
  • مروری بر پژوهش‌های پیشین
    • تخمین مقادیر گمشده
      • K نزدیک‌ترین همسایه‌ی وزن‌دار
      • روش‌ مبتنی بر تجزیه‌ی مقدار تکین
      • روش کاهش رتبه ماتریس
      • روش کم‌رتبه‌ی خطی
    • انتخاب ژن‌های کلیدی و تخمین ژن‌های نامعلوم
      • تخمین ژن‌های نامعلوم با استفاده از رگرسیون خطی و غیرخطی توسط ژن‌های انتخاب شده با روش بیزین
      • D-GEX
    • جمع‌بندی
  • روش پژوهش
    • راهکارهای‌‌ پیشنهادی
      • روش تخمین برای ماتریس کم‌مرتبه
      • روش حریصانه برای یافتن ژن‌های کلیدی
      • الگوریتم تکرارشونده
    • جمع‌بندی
  • شبیه‌سازی و نتایج
    • معرفی دادگان
      • دادگان RNA-Seq پروژه‌ی (GTEx)
      • دادگان میکروآرایه‌ی GEO
      • دادگان Rat Genome Array
    • پیش‌پردازش دادگان
    • پیاده‌سازی روش‌های پیشنهادی
      • پیاده‌سازی روش ارائه‌شده‌ی ماتریسی برای تخمین
      • مقایسه‌ی روش‌های پیشنهادی
      • مقایسه‌ی ژن‌های به‌دست‌آمده از الگوریتم تکرار شونده و k-means
    • معیارهای ارزیابی
      • آموزش، اعتبارسنجی و آزمایش مدل
      • روش‌های سنجش خطا
      • نتایج ارزیابی‌
    • ‌جمع‌بندی
  • جمع‌بندی و کارهای آتی
    • دستاورد‌ها
    • کارهای آینده
  • مراجع
...see more