Loading...
- Type of Document: M.Sc. Thesis
- Language: Farsi
- Document No: 51438 (02)
- University: Sharif University of Technology
- Department: Mathematical Sciences
- Advisor(s): Razvan, Mohammad-Reza; Kamali-Tabrizi, Mostafa
- Abstract:
- Image retrieval refers to the task of finding images related to a query image within an image set. Due to ever-increasing volumes of data, it has become increasingly necessary to find suitable and efficient methods for searching in massive databases. In this thesis, modern image retrieval techniques developed within the last 15 years have been studied, with an aim to satisfy three primary constraints of efficiency, accuracy, and low memory usage. Our focus has been on content-based retrieval; meaning that instead of using text and other information, we directly utilize image features for analysis and processing. To achieve this, we studied two established techniques, the bag-of-words model, and vector of locally aggregated descriptors (VLAD) encoding, and the combination with Convolutional Neural Networks. Furthermore, we developed a new method of VLAD normalization which we call cluster norm. Our results show that this technique has significantly higher performance characteristics than previously used methods
- Keywords:
- Image Retrieval ; Words Bag Model ; Scale Invariant Feature Transform (SIFT)Algorithm ; Vector Of Locally Aggregated Descriptors (VLAD) Method
-
محتواي کتاب
- view
- مقدمه
- کاربردها و اهمیت مسئله
- اهمیت مطالعۀ روشهای بازیابی
- انواع بازیابی تصویر
- سختیهای پیش رو
- نگاهی به مفهوم شباهت
- قیدهای بازیابی مدرن
- چالشهای تصویر
- تحلیل اولیۀ تصویر
- آشکارسازی نقاط مطلوب تصویر
- توصیفگرهای موضعی تصویر
- معیار شباهت
- mAP ارزیابی روش بازیابی تصویر
- ساختار پایاننامه
- کاربردها و اهمیت مسئله
- سبد ویژگی
- سبد کلمات و تعمیم آن برای تصویر
- سبد کلمات
- تعمیم روش برای تصاویر
- هنجارسازی و وزندهی بافتنگار
- وزندهی tf-idf
- انفجار ویژگیها
- خوشهبندی k-means و بهبود آن
- انتخاب نقاط اولیۀ مراکز
- تسریع خوشهبندی
- انتساب یکنواخت ویژگیها
- بهبود بازیابی با توجه به نقاط مطلوب تصویر
- انتخاب نقاط مطلوب مهمتر
- مختصات نقاط مطلوب در تصویر
- بسط تصویر جویش
- جمعبندی
- سبد کلمات و تعمیم آن برای تصویر
- ویلد
- شرح ویلد
- ساخت بردار ویلد
- کاهش بعد بردار ویلد
- مقایسۀ دو تصویر با توصیفگر ویلد
- جستجو در تصاویر: توصیفگر ویلد چندتایی
- سازگارسازی خوشهبندی
- هنجارسازی ویلد
- هنجارهای مختلف برای ویلد
- تحلیل روشهای هنجارسازی
- هنجار خوشهای
- فیشر
- ساخت هستۀ فیشر
- ارائۀ تصویر با بردار فیشر
- مقایسۀ ویلد با سبد ویژگی و فیشر
- شرح ویلد
- بازیابی به کمک شبکههای عصبی پیچشی
- مختصری از تاریخچه
- بازیابی معنا محور
- نتویلد
- مروری بر روش
- معماری شبکه
- نتویلد: ویلد تعمیم یافته
- یادگیری
- جمعبندی
- مختصری از تاریخچه
- پیادهسازی و نتیجهگیری
- مجموعه داده
- جزئیات پیاده سازی
- ساخت لغتنامۀ تصویری
- ارزیابی روشها
- نتایج ویلد با کاهش نقاط مطلوب تصاویر
- کاهش نقاط مطلوب با تعیین آستانه
- کاهش نقاط مطلوب با کوچک کردن تصاویر
- نسبت خوشهها در هنجار خوشهای ویلد
- بررسی 3 تصویر جویش آکسفورد
- پنجمین تصویر جویش Radcliffe Camera
- سومین تصویر جویش All Souls
- چهارمین تصویر جویش All Souls
- نتیجهگیری