Loading...

Improving Graph Construction for Semi-supervised Learning in Computer Vision Applications

Mahdieh, Mostafa | 2013

1338 Viewed
  1. Type of Document: M.Sc. Thesis
  2. Language: Farsi
  3. Document No: 44559 (19)
  4. University: Sharif University of Technology
  5. Department: Computer Engineering
  6. Advisor(s): Rabiee, Hamid Reza
  7. Abstract:
  8. Semi-supervised Learning (SSL) is an extremely useful approach in many applications where unlabeled data can be easily obtained. Graph based methods are among the most studied branches in SSL. Since neighborhood graph is a key component in these methods, we focus on methods of graph construction in this project. Graph construction methods based on Euclidean distance have the common problem of creating shortcut edges. Shortcut edges refer to the edges which connect two nearby points that are far apart on the manifold. Specifically, we show both in theory and practice that using geodesic distance for selecting and weighting edges results in more appropriate neighborhood graphs. We propose an algorithm, called Isograph, that estimates the geodesic distance between pairs of neighboring points based on an arbitrary initial graph (such as k-NN) to improve it. Moreover, theoretical bounds are provided stating that the estimated values of geodesic distances are reasonable and will approach the real values after each iteration. The experimental results on synthetic and real world data, support our claims
  9. Keywords:
  10. Machine Learning ; Semi-Supervised Learning ; Machine Vision ; Graph Construction ; Manifold Assumption

 Digital Object List

 Bookmark

  • مقدمه
    • تعریف ریاضی مسئله یادگیری نیمه‌نظارتی
    • مدل‌سازی داده‌ها
      • فرض همواری نیمه‌نظارتی
      • فرض خمینه
      • فرض نمایش تنک داده‌ها
    • روش‌های یادگیری نیمه‌نظارتی
      • روش‌های مولد
      • روش‌های مبتنی بر فرض جداسازی کم‌چگالی
      • روش‌های مبتنی بر گراف
    • اهمیت مسئله ساخت گراف همسایگی
    • چالش‌های مسئله‌ی ساخت گراف همسایگی
      • مجهول بودن خمینه‌ها
      • داده‌های چند خمینه‌ای
      • همبندی گراف همسایگی
      • یال‌های میان‌بر
      • انتخاب وزن مناسب
      • استفاده از برچسب‌ها
      • استفاده از فرض خمینه
      • زمان اجرا و برخط بودن
    • تعریف دقیق‌تر موضوع رساله
    • بیان رسمی فرض خمینه
      • رابطه‌ی اتشار گرما و استنتاج برچسب
    • مجموعه داده‌ها
      • تشخیص ارقام
      • تشخیص دسته اشیا
      • تشخیص حالت انسان
    • معیارهای ارزیابی الگوریتم‌های ساخت گراف همسایگی
    • جمع‌بندی
    • ساختار رساله
  • تحلیل مسئله ساخت گراف همسایگی
    • تابع فاصله روی فضای ورودی
    • پیش‌پردازش داده‌ها
      • روش PCA
      • حذف نویز از خمینه
    • استنتاج برچسب‌ها
      • روش‌های مبتنی بر انتشار برچسب
      • روش منظم‌سازی گراف
      • پشتوانه‌ی نظری منظم‌سازی گراف
      • روش‌های دیگر استنتاج برچسب
    • چارچوب‌های ساخت گراف همسایگی
      • چارچوب آماری
      • چارچوب مبتنی بر شهود
      • چارچوب هندسی
      • چارچوب ساخت و اصلاح
    • اعتبار فرضیات
    • جمع‌بندی
  • روش‌های پیشین ساخت گراف همسایگی
    • ساخت گراف همسایگی با توجه به دانش مسئله
    • روش‌های عمومی ساخت گراف همسایگی
      • روش‌های پایه
      • روش نمایش تنک
      • روش‌های مبتنی بر حفظ همبندی گراف همسایگی
      • روش‌های مبتنی بر تحدید درجه
      • روش‌های کشف یال‌های میان‌بر
      • ساخت گراف همسایگی نیمه‌نظارتی
    • وزن‌دهی یال‌ها
      • تنظیم پارامترهای تابع گاوسی
      • معیار شباهت با واریانس متفاوت در ابعاد مختلف
      • بازسازی محلی خطی
    • جمع‌بندی و تحلیل
      • دسته‌بندی ضعف کارهای پیشین در زمینه‌ی ساخت گراف همسایگی
      • نحوه پیش‌برد مسئله
  • روش پیشنهادی
    • آزمایش روی داده‌های واقعی
    • انگیزش
    • رجحان متریک ژئودزیک نسبت به متریک اقلیدسی
      • تخمین محلی اپراتور لاپلاس-بلترامی
      • تخمین ژئودزیکی اپراتور لاپلاس-بلترامی
      • روش نزدیک‌ترین همسایه‌ی ژئودزیکی
      • آزمایش‌ها
      • نتیجه‌ تحلیل‌ها
    • روش پیشنهادی
      • الگوریتم ایزوگراف
      • تحلیل زمان اجرا
      • مسائل پیاده‌سازی
      • جمع‌بندی
  • تحلیل نظری روش پیشنهادی
    • پیچیدگی زمان اجرا
    • جمع‌بندی
  • آزمایش روی مجموعه داده‌ها
    • مجموعه‌های داده‌ی مصنوعی
    • مجموعه‌های داده‌ی واقعی
    • مقایسه روش‌های تشخیص یال میان‌بر
      • جمع‌بندی
  • جمع‌بندی و کارهای آتی
...see more