Loading...
Identifying Core Genes in Estimation of Missing Gene Expressions
Darvish Shafighi, Shadi | 2017
1261
Viewed
- Type of Document: M.Sc. Thesis
- Language: Farsi
- Document No: 50715 (19)
- University: Sharif University of Technology
- Department: Computer Engineering
- Advisor(s): Motahari, Abolfazl
- Abstract:
- Characterizing cellular states in response to various disease conditions is an important issue which is addressed by different methods such as Large-scale gene expression profiling. One of the most important challenges in front of bioinformaticians is the loss of data because expression profiling is still very expensive. It is understood that profiling a group of selected genes could be enough for understanding all of the gene expression profile.In this research, we propose a fast method for estimation of the missing values inlow-rank matrices. We consider the highly correlated expression profiles as a low-rank matrix. Then, we used this new method in a proposed algorithm which will select the landmark genes and also estimate the target genes iteratively. The algorithm tries to enhance the representation of the landmark genes in each iteration.The proposed algorithm was successful compared to the related works. It could help in the process of lowering the expenses of the Large-scale gene-expression profiling. The improvement of the estimation error was 3.2 percent compare to the best method which is D-GEX.Also we capture the errors which are significant in both methods and find that we could reduce the significant errors 21 percent in comparison with D-GEX
- Keywords:
- Estimation ; Gene Expression Data ; Bioloical Data ; Retrofiting ; Landmark Genes ; Target Genes
-
محتواي کتاب
- view
- فهرست شکلها
- فهرست جدولها
- مقدمه
- تعریف مسئله
- اهمیت
- چالشها
- ساختار پایاننامه
- مفاهیم زیستشناسی و یادگیری ماشین
- مفاهیم زیستشناسی
- مولکول DNA
- ژن
- تولید پروتئین
- بیان ژن
- یادگیری ماشین
- رگرسیون
- تجزیهی مقدار تکین
- شبکه عصبی
- دستهبندی k-means
- روش حریصانه و بدون ناظر برای انتخاب زیرمجموعهای از ستونها
- مفاهیم زیستشناسی
- مروری بر پژوهشهای پیشین
- تخمین مقادیر گمشده
- K نزدیکترین همسایهی وزندار
- روش مبتنی بر تجزیهی مقدار تکین
- روش کاهش رتبه ماتریس
- روش کمرتبهی خطی
- انتخاب ژنهای کلیدی و تخمین ژنهای نامعلوم
- تخمین ژنهای نامعلوم با استفاده از رگرسیون خطی و غیرخطی توسط ژنهای انتخاب شده با روش بیزین
- D-GEX
- جمعبندی
- تخمین مقادیر گمشده
- روش پژوهش
- راهکارهای پیشنهادی
- روش تخمین برای ماتریس کممرتبه
- روش حریصانه برای یافتن ژنهای کلیدی
- الگوریتم تکرارشونده
- جمعبندی
- راهکارهای پیشنهادی
- شبیهسازی و نتایج
- معرفی دادگان
- دادگان RNA-Seq پروژهی (GTEx)
- دادگان میکروآرایهی GEO
- دادگان Rat Genome Array
- پیشپردازش دادگان
- پیادهسازی روشهای پیشنهادی
- پیادهسازی روش ارائهشدهی ماتریسی برای تخمین
- مقایسهی روشهای پیشنهادی
- مقایسهی ژنهای بهدستآمده از الگوریتم تکرار شونده و k-means
- معیارهای ارزیابی
- آموزش، اعتبارسنجی و آزمایش مدل
- روشهای سنجش خطا
- نتایج ارزیابی
- جمعبندی
- معرفی دادگان
- جمعبندی و کارهای آتی
- دستاوردها
- کارهای آینده
- مراجع