Loading...
- Type of Document: M.Sc. Thesis
- Language: Farsi
- Document No: 44757 (19)
- University: Sharif University of Technology
- Department: Computer Engineering
- Advisor(s): Ghanbari, Mohammad
- Abstract:
- Scene classification and understanding is one of the most important fields in computer vision. Its applications are such as exploring robot navigation enviroment, content-based image retrieval (CBIR), organization in image databases, highly semantic describing images and videos and content extraction of videos.Many methods and algorithm are proposed till today to deal with diversity of this field by emphesizing on feature based methods or machine learning based methods. In this research we have focoused on proposing a new algorithm which is using principals of NBNN image classification method but major changes in how to exract distance metric from Nearest neighbour and how to use local features and descriptors like SIFT, HOG, Gist ... for computing these distance. We use our new method to classify video events by segmenting video frames to important objects and main parts for extraction more accurate visual dictionary of video sources. Hiring state of the art algorithm like max-margin multiple instance learning helped us to achieve more reliable visual dictionary for each category of scenes or events.This method gain state of the art results rescpet to the other related methods including parametrics and non-parametrics on the famous indoor and outdoor scene databse like MIT 67-indoor scene, 15 category scene, UIUC 8 sports events and video event MED11 dataset
- Keywords:
- Classification ; Scene Recognition ; Nearest Neighbor ; Scene Classification ; Video Images ; Image Segmentation ; Naive Bayes Nearest Neighbor (NBNN)
-
محتواي کتاب
- view
- فصل 1 : مقدمه
- 1-1 تعریف مسأله
- 1-1 ساختار پایاننامه
- فصل 2 : روش ها و الگوریتم های مرتبط
- 2-1 ویژگی های پایه ای مورد استفاده
- 2-1-1 ویژگی سیفت
- 2-1-2 ویژگی هیستوگرام گرادیانهای جهت دار
- 2-1-3 جیست
- 2-1-4 الگوی محلی باینری
- 2-1-5 هیستوگرام تبدیل سنسوس
- 2-2 ادبیات موضوع: نمایش و استفاده از ویژگیها
- 2-2-1 بسته کلمات
- 2-2-2 هرم تطابق مکانی
- 2-3 روشهای مرتبط دسته بندی صحنه
- 2-3-1 روشهای مبتنی بر ویژگی
- 2-3-1-1 روشهای مبتنی بر کوانتیزاسیون برداری
- 2-3-1-2 دسته بندی بوسیله مناطق دلخواه
- 2-3-1-3 دسته بندی ویدئو مبتنی بر ویژگی
- 2-3-2 روشهای مبتنی بر توصیفهای سطح بالا
- 2-3-2-1 روش بانک اشیاء
- 2-3-2-2 مدل تغییرپذیر بر پایه اجزا
- 2-3-2-3 مناطق هرمی پنهان(LPR)
- 2-3-2-4 دسته بندی با بخشهای متمایز
- 2-3-2-5 تشخیص صحنه ویدئو با استفاده از نمایش مفهومی
- 2-3-1 روشهای مبتنی بر ویژگی
- 2-4 نتیجه گیری فصل
- 2-1 ویژگی های پایه ای مورد استفاده
- فصل 3 -روش پیشنهادی
- 3-1 نزدیک ترین همسایه بیز ساده (NBNN)
- 3-1-1 تشریح الگوریتم NBNN
- 3-1-2 هسته NBNN
- 3-1-3 معایب NBNN
- 3-2 الگوریتم پیشنهادی (NBNN-LLE)
- 3-2-1 دسته لغت نامه
- 3-2-2 بدست آوردن فواصل دقیق
- 3-2-3 هسته NBNN-LLE
- 3-3 ویژگیهای مورد استفاده
- 3-4 راهکاری برای دسته بندی دقیق ویدئو
- 3-5 نتیجهگیری فصل
- 3-1 نزدیک ترین همسایه بیز ساده (NBNN)
- فصل 4 - پایگاههای داده و نتایج روش پیشنهادی
- 4-1 پایگاه داده 8 رخداد ورزشی
- 4-2 پایگاه داده 15 دسته صحنه
- 4-3 پایگاه داده 67 صحنه داخلی
- 4-4 پایگاه داده تصاویر ویدئویی 15 رخداد
- 4-5 مقایسه روشهای یادگیری لغتنامه
- فصل 5 -جمع بندی و راهکارهای آتی
- فهرست مراجع
