Loading...
Cancer Detection and Classification in Histopathology Images Under Small Training Set
Askari Farsangi, Amir Hossein | 2022
814
Viewed
- Type of Document: M.Sc. Thesis
- Language: Farsi
- Document No: 55133 (19)
- University: Sharif University of Technology
- Department: Computer Engineering
- Advisor(s): Rohban, Mohammad Hossein; Sharifi Zarchi, Ali
- Abstract:
- Histopathology images are a type of medical images that are used to diagnose a variety of diseases. One of these illnesses is the Leukemia cancer, which has four different subtypes and is diagnosed using a blood smear image. As a result of the advancement of deep learning tools, models for diagnosing various types of disease from images have been developed in recent years.In this project, one of the best models developed to diagnose four different types of disease was replicated, and it was demonstrated that, while this model achieves acceptable accuracy, its decision is not based on medically significant criteria. In the following, a general method for diagnosing the disease is proposed based on some important medical criteria. This method is comprised of the following steps: detection of white blood cells; analysis of each cell image; summarization of the results; and final judgment. Cell detection in blood smear images, a white blood cell classifier, and a segmentation tool are required to develop this method. Each of these tools has been thoroughly investigated in this project, and new and significant achievements have been made in relation to them, such as a robust method for white blood cell classification and high-quality cell segmentation with a small dataset. It was demonstrated that there is an inherent challenge in decision-making based on images for the final diagnosis of Leukemia in the case of simultaneous diagnosis of all types of disease and that to diagnose, a large number of images of a patient must be examined. For this purpose, a model has been developed that overcomes this problem as much as possible and can achieve an accuracy of 81.79 percent in the simplified problem of distinguishing between a healthy sample, a chronic patient, and an acute patient. Finally, an interpretable LSTM-based model was developed to distinguish between ALL and healthy samples, which can achieve 91.11 accuracy in diagnosis while overcoming this inherent challenge. Because of the limited data sets, the models are forced to use a small training data set at all stages of this project
- Keywords:
- Cancer Diagnosis ; Data Augmentation ; Small Training Set ; Histopathology Images ; Leukemia ; Image Processing
-
محتواي کتاب
- view
- مقدمه
- اهمیت موضوع
- مجموعه دادههای موجود
- مجوعه داده ALL IDB
- پایگاه اینترنتی ASH Image Bank
- پایگاه داده Raabin
- شرح مسئله
- مرور مختصر دستاوردهای پروژه
- کارهای پیشین
- کارهای پیشین مربوط به مسئله تشخیص سرطان
- نقاط ضعف روشهای گذشته
- مسئله تشخیص سلولهای خونی
- روشهای مواجهه با داده برچسبخورده کم
- قطعهبندی تصاویر و تشخیص اشیاء
- کارهای پیشین مربوط به مسئله تشخیص سرطان
- بررسی چالشهای موجود در مسئله
- مسئله تشخیص ALL از سالم
- مقدمه
- طبقهبندی تک سلوله
- قطعهبندی و پیدا کردن سلول
- جمعبندی و نتیجهگیری مسئله تشخیص ALL از سالم
- مسئله تشخیص انواع سرطان مزمن و حاد(مسئله پنج دستهای)
- مقدمه
- مجموعه داده
- مدل CNN
- مدل Vision Transformer
- مدلهای خودنظارتی
- جمعبندی و نتیجهگیری مسئله پنجدستهای
- مسئله تشخیص ALL از سالم
- تشریح مسئله و روش پیشنهادی
- شرح مسئله
- بحث پزشکی
- روش پیشنهادی
- ابزارهای لازم برای توسعه روش
- مجموعه داده رابین
- مجوعه داده گلبولهای سفید
- مجوعه داده لوکمیا
- تشخیص لوکمیا
- مقدمه
- مدلهای تشخیص پنج دستهای
- مدلهای بر پایه Multiple Instance Learning
- مدل پردازش آلبوم سلولی
- مدلهای تشخیص دو دستهای
- مدلهای برپایه شمارش سلول برای تشخیص ALL
- معماری LSTM و استفاده از استخراجکنندههای ویژگی از پیش آموزشدیده
- جمعبندی و نتیجهگیری
- نتیجهگیری
- مدلهای خودنظارتی
- مدلهای خودنظارتی
- مدل SiT
- مدل MoCo
- مدلهای خودنظارتی
- تشخیص سلول
- مقدمه
- مجموعه داده مورد استفاده
- مجموعه داده ALL IDB 1
- مجموعه داده رابین
- مدل Faster RCNN برای تشخیص سلول بلاست و سالم
- آموزش و ارزیابی مدل
- ارزیابی غیر مستقیم مدل روی مجموعه داده لوکمیا رابین
- مدل تشخیصدهنده سلول گلبول سفید و تعیینکننده نوع آن
- چالش آموزش مستقیم
- مدل دو مرحلهای
- مدل تشخیصدهنده سلول گلبول سفید
- ارزیابی روی مجموعه داده با توزیع متفاوت
- جمعبندی و نتیجهگیری
- تشخیص نوع گلبولهای سفید
- هدف
- شبکه تک خروجی
- مجموعه داده تک برچسبه
- شبکه تک خروجی با پایه CNN
- شبکه تک خروجی با پایه Vision Transformer
- شبکه دو خروجی
- مجموعه داده دو برچسبه
- شبکه دو خروجی با پایه CNN
- شبکه دو خروجی با پایه ٰVision Transformer
- افزودن داده Artefact
- هدف
- مجموعه داده
- نتایج
- جمعبندی و نتیجهگیری
- قطعه بندی سلول
- هدف
- قطعهبندی تصاویر تک سلول
- قطعهبندی با استفاده از شبکه خودکدگذار
- قطعهبندی با استفاده از شبکه U-Net
- مدل دو خروجی
- قطعهبندی تصاویر اسلاید کامل
- تعمیم مدلهای کانولوشنی
- تعمیم بر پایه موزائیک کردن
- تعمیم بر پایه مدلهای تشخیص سلول
- جمعبندی و نتیجهگیری