Loading...

Cancer Detection and Classification in Histopathology Images Under Small Training Set

Askari Farsangi, Amir Hossein | 2022

814 Viewed
  1. Type of Document: M.Sc. Thesis
  2. Language: Farsi
  3. Document No: 55133 (19)
  4. University: Sharif University of Technology
  5. Department: Computer Engineering
  6. Advisor(s): Rohban, Mohammad Hossein; Sharifi Zarchi, Ali
  7. Abstract:
  8. Histopathology images are a type of medical images that are used to diagnose a variety of diseases. One of these illnesses is the Leukemia cancer, which has four different subtypes and is diagnosed using a blood smear image. As a result of the advancement of deep learning tools, models for diagnosing various types of disease from images have been developed in recent years.In this project, one of the best models developed to diagnose four different types of disease was replicated, and it was demonstrated that, while this model achieves acceptable accuracy, its decision is not based on medically significant criteria. In the following, a general method for diagnosing the disease is proposed based on some important medical criteria. This method is comprised of the following steps: detection of white blood cells; analysis of each cell image; summarization of the results; and final judgment. Cell detection in blood smear images, a white blood cell classifier, and a segmentation tool are required to develop this method. Each of these tools has been thoroughly investigated in this project, and new and significant achievements have been made in relation to them, such as a robust method for white blood cell classification and high-quality cell segmentation with a small dataset. It was demonstrated that there is an inherent challenge in decision-making based on images for the final diagnosis of Leukemia in the case of simultaneous diagnosis of all types of disease and that to diagnose, a large number of images of a patient must be examined. For this purpose, a model has been developed that overcomes this problem as much as possible and can achieve an accuracy of 81.79 percent in the simplified problem of distinguishing between a healthy sample, a chronic patient, and an acute patient. Finally, an interpretable LSTM-based model was developed to distinguish between ALL and healthy samples, which can achieve 91.11 accuracy in diagnosis while overcoming this inherent challenge. Because of the limited data sets, the models are forced to use a small training data set at all stages of this project
  9. Keywords:
  10. Cancer Diagnosis ; Data Augmentation ; Small Training Set ; Histopathology Images ; Leukemia ; Image Processing

 Digital Object List

 Bookmark

  • مقدمه
    • اهمیت موضوع
    • مجموعه داده‌های موجود
      • مجوعه داده ALL IDB
      • پایگاه اینترنتی ASH Image Bank
      • پایگاه داده Raabin
    • شرح مسئله
    • مرور مختصر دستاورد‌های پروژه
  • کارهای پیشین
    • کار‌های پیشین مربوط به مسئله تشخیص سرطان
      • نقاط ضعف روش‌های گذشته
    • مسئله تشخیص سلول‌های خونی
    • روش‌های مواجهه با داده برچسب‌خورده کم
    • قطعه‌بندی تصاویر و تشخیص اشیاء
  • بررسی چالش‌های موجود در مسئله
    • مسئله تشخیص ALL از سالم
      • مقدمه
      • طبقه‌بندی تک سلوله
      • قطعه‌بندی و پیدا کردن سلول
      • جمع‌بندی و نتیجه‌گیری مسئله تشخیص ALL از سالم
    • مسئله تشخیص انواع سرطان مزمن و حاد(مسئله پنج دسته‌ای)
      • مقدمه
      • مجموعه داده
      • مدل CNN
      • مدل Vision Transformer
      • مدل‌های خودنظارتی
      • جمع‌بندی و نتیجه‌گیری مسئله پنج‌دسته‌ای
  • تشریح مسئله و روش پیشنهادی
    • شرح مسئله
    • بحث پزشکی
    • روش پیشنهادی
    • ابزار‌های لازم برای توسعه روش
    • مجموعه داده رابین
      • مجوعه داده گلبول‌های سفید
      • مجوعه داده لوکمیا
  • تشخیص لوکمیا
    • مقدمه
    • مدل‌های تشخیص پنج دسته‌ای
      • مدل‌های بر پایه Multiple Instance Learning
      • مدل پردازش آلبوم سلولی
    • مدل‌های تشخیص دو دسته‌ای
      • مدل‌های برپایه شمارش سلول برای تشخیص ALL
      • معماری LSTM و استفاده از استخراج‌کننده‌های ویژگی از پیش آموزش‌دیده
      • جمع‌بندی و نتیجه‌گیری
  • نتیجه‌گیری
  • مدل‌های خودنظارتی
    • مدل‌های خودنظارتی
      • مدل SiT
      • مدل MoCo
  • تشخیص سلول
    • مقدمه
    • مجموعه داده مورد استفاده
      • مجموعه داده ALL IDB 1
      • مجموعه داده رابین
    • مدل Faster RCNN برای تشخیص سلول بلاست و سالم
      • آموزش و ارزیابی مدل
      • ارزیابی غیر مستقیم مدل روی مجموعه داده لوکمیا رابین
    • مدل تشخیص‌دهنده سلول گلبول سفید و تعیین‌کننده نوع آن
      • چالش آموزش مستقیم
      • مدل دو مرحله‌ای
    • مدل تشخیص‌دهنده سلول گلبول سفید
    • ارزیابی روی مجموعه داده با توزیع متفاوت
    • جمع‌بندی و نتیجه‌گیری
  • تشخیص نوع گلبول‌های سفید
    • هدف
    • شبکه تک خروجی
      • مجموعه داده تک برچسبه
      • شبکه تک خروجی با پایه CNN
      • شبکه تک خروجی با پایه Vision Transformer
    • شبکه دو خروجی
      • مجموعه داده دو برچسبه
      • شبکه دو خروجی با پایه CNN
      • شبکه دو خروجی با پایه ٰVision Transformer
    • افزودن داده Artefact
      • هدف
      • مجموعه داده
      • نتایج
    • جمع‌بندی و نتیجه‌گیری
  • قطعه بندی سلول
    • هدف
    • قطعه‌بندی تصاویر تک سلول
      • قطعه‌بندی با استفاده از شبکه خودکدگذار
      • قطعه‌بندی با استفاده از شبکه U-Net
      • مدل دو خروجی
    • قطعه‌بندی تصاویر اسلاید کامل
      • تعمیم مدل‌های کانولوشنی
      • تعمیم بر پایه موزائیک کردن
      • تعمیم بر پایه مدل‌های تشخیص سلول
    • جمع‌بندی و نتیجه‌گیری
...see more