Loading...
- Type of Document: M.Sc. Thesis
- Language: Farsi
- Document No: 56914 (19)
- University: Sharif University of Technology
- Department: Computer Engineering
- Advisor(s): Soleymani Baghshah, Mahdieh
- Abstract:
- Few-shot learning methods have achieved notable performance in recent years. However, fewshot learning in large-scale settings with hundreds of classes is still challenging. In this dissertation, we tackle the problems of large-scale few-shot learning by taking advantage of pre-trained foundation models. We recast the original problem in two levels with different granularity. At the coarse-grained level, we introduce a novel object recognition approach with robustness to sub-population shifts. At the fine-grained level, generative experts are designed for few-shot learning, specialized for different superclasses. A Bayesian schema is considered to combine coarse-grained information with fine-grained predictions in a winnertakes-all fashion. Extensive experiments on large-scale datasets and different architectures show that the proposed method is both effective and efficient besides its simplicity and natural problem remodeling.
- Keywords:
- Deep Learning ; Few-Shot Learning ; Hierarchical Classification ; Generalization ; Robustness ; Bayesian Learning ; Large-Scale Classification
-
محتواي کتاب
- view
- 1 مقدمه
- 1-1 تعریف مسئله
- 1-2 رویکرد حل مسئله
- 1-2.1 معماری مدل سطح درشتدانه
- 1-2.2 معماری مدل سطح ریزدانه
- 1-2.3 تنظیمات متاآموزش و متاآزمون
- 1-3 چالشها
- 1-3.1 محدودیت تعداد کلاس در روشهای نمونه محدود
- 1-3.2 مجموعهباز بودن دستهبندی بزرگ مقیاس
- 1-3.3 انتشار خطا در سلسلهمراتب
- 1-4 اهمیت و کاربرد
- 1-5 هدف پژوهش
- 1-6 کد پیادهسازی و منابع جانبی
- 1-7 ساختار پایاننامه
- 2 پژوهشهای پیشین
- 2-1 یادگیری نمونه محدود با دادهافزایی
- 2-1.1 دادهافزایی در سطح بردار ویژگی
- 2-1.2 دادهافزایی در سطح نمونه
- 2-2 متایادگیری
- 2-2.1 ساختار کلی الگوریتم متایادگیری
- 2-2.2 روشهای مبتنی بر بهینهسازی
- 2-2.3 روشهای جعبه سیاهBlack Box
- 2-2.4 روشهای مبتنی بر مترMetric Based
- 2-2.5 اشتراک تجربهی احتمالاتی
- 2-3 استفاده از بدنهBackbone بیانگرExpressive برای رسیدن به کارایی نمونهSample Efficiency
- 2-4 خاصیت مجموعه باز بودن
- 2-4.1 رویکرد سلبی؛ شناسایی دستههای بدیع
- 2-4.2 رویکرد ایجابی؛ تنظیم مدل با اضافه کردن توانایی طبقهبندی دستههای جدید
- 2-5 یادگیری سلسلهمراتبی نمونه محدود
- 2-6 جمعبندی
- 2-1 یادگیری نمونه محدود با دادهافزایی
- 3 راهکار پیشنهادی
- 3-1 نمادگذاری مسئله و پیشنیازها
- 3-2 دستهبند سطح درشتدانه
- 3-3 یادگیرنده نمونه محدود در سطح ریزدانه
- 3-4 جمعبندی روش و ارائهی شبهکد
- 4 ارزیابی
- 4-1 معرفی مجموعه دادههای مورد استفاده
- 4-2 معرفی بدنه استخراجگر ویژگی
- 4-3 جزییات معماری سطح درشتدانه
- 4-4 جزییات معماری سطح ریزدانه
- 4-5 روشهای پایهBaselines و نحوهی مقایسه
- 4-6 نتایج
- 4-7 تنظیمات هایپرپارامترها
- 4-8 منابع سختافزاری
- 4-9 جمعبندی
- 5 جمعبندی و کارهای آتی
- 5-1 جمعبندی و نقاط قوت روش
- 5-2 کارهای آتی
- مراجع