Loading...
Improving Graph Construction for Semi-supervised Learning in Computer Vision Applications
Mahdieh, Mostafa | 2013
1338
Viewed
- Type of Document: M.Sc. Thesis
- Language: Farsi
- Document No: 44559 (19)
- University: Sharif University of Technology
- Department: Computer Engineering
- Advisor(s): Rabiee, Hamid Reza
- Abstract:
- Semi-supervised Learning (SSL) is an extremely useful approach in many applications where unlabeled data can be easily obtained. Graph based methods are among the most studied branches in SSL. Since neighborhood graph is a key component in these methods, we focus on methods of graph construction in this project. Graph construction methods based on Euclidean distance have the common problem of creating shortcut edges. Shortcut edges refer to the edges which connect two nearby points that are far apart on the manifold. Specifically, we show both in theory and practice that using geodesic distance for selecting and weighting edges results in more appropriate neighborhood graphs. We propose an algorithm, called Isograph, that estimates the geodesic distance between pairs of neighboring points based on an arbitrary initial graph (such as k-NN) to improve it. Moreover, theoretical bounds are provided stating that the estimated values of geodesic distances are reasonable and will approach the real values after each iteration. The experimental results on synthetic and real world data, support our claims
- Keywords:
- Machine Learning ; Semi-Supervised Learning ; Machine Vision ; Graph Construction ; Manifold Assumption
-
محتواي کتاب
- view
- مقدمه
- تعریف ریاضی مسئله یادگیری نیمهنظارتی
- مدلسازی دادهها
- فرض همواری نیمهنظارتی
- فرض خمینه
- فرض نمایش تنک دادهها
- روشهای یادگیری نیمهنظارتی
- روشهای مولد
- روشهای مبتنی بر فرض جداسازی کمچگالی
- روشهای مبتنی بر گراف
- اهمیت مسئله ساخت گراف همسایگی
- چالشهای مسئلهی ساخت گراف همسایگی
- مجهول بودن خمینهها
- دادههای چند خمینهای
- همبندی گراف همسایگی
- یالهای میانبر
- انتخاب وزن مناسب
- استفاده از برچسبها
- استفاده از فرض خمینه
- زمان اجرا و برخط بودن
- تعریف دقیقتر موضوع رساله
- بیان رسمی فرض خمینه
- رابطهی اتشار گرما و استنتاج برچسب
- مجموعه دادهها
- تشخیص ارقام
- تشخیص دسته اشیا
- تشخیص حالت انسان
- معیارهای ارزیابی الگوریتمهای ساخت گراف همسایگی
- جمعبندی
- ساختار رساله
- تحلیل مسئله ساخت گراف همسایگی
- تابع فاصله روی فضای ورودی
- پیشپردازش دادهها
- روش PCA
- حذف نویز از خمینه
- استنتاج برچسبها
- روشهای مبتنی بر انتشار برچسب
- روش منظمسازی گراف
- پشتوانهی نظری منظمسازی گراف
- روشهای دیگر استنتاج برچسب
- چارچوبهای ساخت گراف همسایگی
- چارچوب آماری
- چارچوب مبتنی بر شهود
- چارچوب هندسی
- چارچوب ساخت و اصلاح
- اعتبار فرضیات
- جمعبندی
- روشهای پیشین ساخت گراف همسایگی
- ساخت گراف همسایگی با توجه به دانش مسئله
- روشهای عمومی ساخت گراف همسایگی
- روشهای پایه
- روش نمایش تنک
- روشهای مبتنی بر حفظ همبندی گراف همسایگی
- روشهای مبتنی بر تحدید درجه
- روشهای کشف یالهای میانبر
- ساخت گراف همسایگی نیمهنظارتی
- وزندهی یالها
- تنظیم پارامترهای تابع گاوسی
- معیار شباهت با واریانس متفاوت در ابعاد مختلف
- بازسازی محلی خطی
- جمعبندی و تحلیل
- دستهبندی ضعف کارهای پیشین در زمینهی ساخت گراف همسایگی
- نحوه پیشبرد مسئله
- روش پیشنهادی
- آزمایش روی دادههای واقعی
- انگیزش
- رجحان متریک ژئودزیک نسبت به متریک اقلیدسی
- تخمین محلی اپراتور لاپلاس-بلترامی
- تخمین ژئودزیکی اپراتور لاپلاس-بلترامی
- روش نزدیکترین همسایهی ژئودزیکی
- آزمایشها
- نتیجه تحلیلها
- روش پیشنهادی
- الگوریتم ایزوگراف
- تحلیل زمان اجرا
- مسائل پیادهسازی
- جمعبندی
- تحلیل نظری روش پیشنهادی
- پیچیدگی زمان اجرا
- جمعبندی
- آزمایش روی مجموعه دادهها
- مجموعههای دادهی مصنوعی
- مجموعههای دادهی واقعی
- مقایسه روشهای تشخیص یال میانبر
- جمعبندی
- جمعبندی و کارهای آتی