Loading...

Multi-omic Single-cell Data Integration Using Deep Neural Networks

Omidi, Alireza | 2021

695 Viewed
  1. Type of Document: M.Sc. Thesis
  2. Language: Farsi
  3. Document No: 54502 (19)
  4. University: Sharif University of Technology
  5. Department: Computer Engineering
  6. Advisor(s): Sharifi Zarchi, Ali
  7. Abstract:
  8. The advent and advance of single-cell technologies have enabled us to measure the cell function and identity by using different assays and viewing it by different technologies. Nowadays, we are able to measure multiple feature vectors from same- single cells from multiple abstract molecular levels (genome, transcriptome, proteome, ...) simultaneously. Hence, the analysts can view the cell from different yet correlated angles and study their behaviours. Such progress in joint single-cell assessments plus the development and spread of more common single-cell assays - that measure one feature vector per cell - caused the growing need for computational tools to integrate these datasets in order to analyze the heterogeneity of the cells more effective.In this paper, we propose Multigrate, a novel method based on variational auto-encoders (VAEs) capable of integrating paired and unpaired single-cell datasets. We evaluate Multigrate on various real-world single-cell datasets, from paired ones to unpaired ones. Furthermore, we propose another novelty by which we make Multigrate able to map query datasets to a previously-learned reference integration space. The latter novelty helps us to analyze and annotate newly coming datasets incorporating reference datasets without the need to have those reference datasets available at the query time and with a cost of a few fine-tuning iterations
  9. Keywords:
  10. Deep Neural Networks ; Variational Autoencoder ; Single Cell Sequencing ; Data Aggregation ; Multi-Omic Data ; Query to Reference Mapping

 Digital Object List

 Bookmark

  • مقدمه و پیش‌نیازها
    • پیش‌نیازهای زیست‌شناسی
    • خودرمزگذار
    • تعریف مسئله ادغام دادگان‌های تک-سلول
    • تعریف مسئله نگاشت دادگان تک-سلول جدید به ادغام مرجع
    • ویژگی‌های داده و مسئله
    • اهداف تحقیق
    • ساختار پایان‌نامه
  • پژوهش‌های پیشین
    • روش MOFA+
    • روش Seurat
    • روش totalVI
    • روش MMD-MA
    • روش UnionCom
    • روش Cross-modal Autoencoder
    • روش SCIM
    • روش scArches
    • جمع‌بندی
  • روش پیشنهادی
    • معماری
    • بهینه‌سازی
      • خطای بازسازی
      • خطای واگرایی KL
      • خطای ادغام
      • خطای ثبات دور
    • روش پیشنهادی برای نگاشت به ادغام مرجع
  • چارچوب ارزیابی
    • دادگان‌های مورد بررسی
      • دادگان توالی‌یابی همزمان آران‌ای و اتک 10x Genomics
      • دادگان توالی‌یابی همزمان آران‌ای و پروتئین‌های سطحی
      • دادگان توالی‌یابی همزمان آران‌ای و پروتئین‌های سطحی بیماران مبتلا به کووید۱۹
    • معیارهای اندازه‌گیری کارایی مدل در ادغام داده‌های تک-سلول
      • معیار Average silhouette width (ASW)
      • معیار Graph connectivity
      • معیار Normalised mutual information (NMI)
      • معیار Adjusted Rand Index (ARI)
      • معیار Isolated label silhouette
    • نحوه ارزیابی کیفیت نگاشت دادگان جدید به ادغام مرجع
    • مطالعه تاثیر ابرپارامترهای مدل بر روی کارایی آن
    • جمع‌بندی
  • ارزیابی
    • ارزیابی کارایی مدل بر روی دادگان‌های جفت‌شده
    • ارزیابی کارایی مدل بر روی دادگان‌های جفت نشده
    • ارزیابی کارایی مدل در نگاشت دادگان جدید به ادغام مرجع
    • مطالعه تاثیر ابرپارامترهای مدل بر روی کارایی آن
  • نتیجه‌گیری و کارهای آتی
  • تصاویر و جداول تکمیلی
...see more