Loading...
Prediction Normal and Colon Cancer Samples by Gene Expression Through Neural Network
Esmaeili, Sina | 2024
0
Viewed
- Type of Document: M.Sc. Thesis
- Language: Farsi
- Document No: 57631 (02)
- University: Sharif University of Technology
- Department: Mathematical Sciences
- Advisor(s): Foroughmand Araabi, Mohammad Hadi
- Abstract:
- Colon cancer is one of the most common and dangerous cancers, with a high mortality rate. Early diagnosis and accurate prediction of this disease are crucial for effective treatment of patients. This study aims to predict and diagnose colon cancer at an early stage using gene expression data. The main challenges in this field include the high dimensionality of gene expression data, the limited number of samples, and imbalanced data. Previous research has utilized feature selection methods to identify genes associated with colon cancer and applied machine learning algorithms to predict this cancer. In this thesis, we examine a feature selection method that utilizes Kullback-Leibler divergence to identify genes with higher divergence values as input features for the model. Subsequently, we introduce a neural network model with two hidden layers, where the loss function of the model is a focal loss function. Our results demonstrate that the proposed neural network model achieves an accuracy of 97.52%, a precision of 98.2%, a recall of 99.19%, an F-score of 98.68%, and an area under the receiver operating characteristic curve (AUC) of 99.59%, indicating its effective performance. Comparing our results with the previous studies, our proposed model has shown superior accuracy in certain metrics such as recall, F-score, and AUC, and has also outperformed four commonly used machine learning algorithms. These findings suggest that our proposed approach has successfully improved the accuracy and efficiency of existing methods and can be used as an effective tool for the early detection of colon cancer
- Keywords:
- Colon Cancer ; Gene Expression Data ; Gene Selection ; Kullback-Leibler Divergence ; Neural Network ; Focal Loss ; Cancer Diagnosis
-
محتواي کتاب
- view
- مقدمه
- تعاریف و مفاهیم پایه مورد نیاز در پژوهش
- پیشینه تحقیقات
- استفاده از دو روش آزمون T و اطلاعات متقابل برای انتخاب ژنهای مهم
- استفاده از فیلترهای FIR برای انتخاب ژنهای مهم
- استفاده از سه روش امتیاز ،F آزمون خی دو و حداقل افزونگی و حداکثر ارتباط برای انتخاب ژنهای مهم
- استفاده از دو روش آزمون خی دو و حداقل افزونگی و حداکثر ارتباط برای انتخاب ژنهای مهم
- استفاده از یک درخت تصمیم بدون هرس برای انتخاب ژنهای مهم
- استفاده از روش بهره اطلاعات برای انتخاب ژنهای مهم
- استفاده از معیار امتیاز لاپلاسی برای انتخاب ژنهای مهم
- استفاده از دو روش میانگین کاهش دقت و میانگین کاهش ناخالصی جینی برای انتخاب ژنهای مهم
- استفاده از دو روش تبدیل هیلبرت و الگوریتم کرم شبتاب برای انتخاب ژنهای مهم
- استفاده از دو روش آزمون T و الگوریتم خی دو برای انتخاب ژنهای مهم
- استفاده از دو روش میانگین کاهش ناخالصی و الگوریتم بروتا برای انتخاب ژنهای مهم
- استفاده از روش خطرات متناسب کاکس برای انتخاب ژنهای مهم
- مقایسه روشهای پیشین در زمینه تشخیص سرطان
- راهکار پیشنهادی
- نتایج و ارزیابی
- نتیجهگیری
- مراجع
- واژهنامه
- attachment1.pdf
- attachment1.pdf
- Page 1