Loading...

Video Scene Recognition

Diba, Ali | 2013

1682 Viewed
  1. Type of Document: M.Sc. Thesis
  2. Language: Farsi
  3. Document No: 44757 (19)
  4. University: Sharif University of Technology
  5. Department: Computer Engineering
  6. Advisor(s): Ghanbari, Mohammad
  7. Abstract:
  8. Scene classification and understanding is one of the most important fields in computer vision. Its applications are such as exploring robot navigation enviroment, content-based image retrieval (CBIR), organization in image databases, highly semantic describing images and videos and content extraction of videos.Many methods and algorithm are proposed till today to deal with diversity of this field by emphesizing on feature based methods or machine learning based methods. In this research we have focoused on proposing a new algorithm which is using principals of NBNN image classification method but major changes in how to exract distance metric from Nearest neighbour and how to use local features and descriptors like SIFT, HOG, Gist ... for computing these distance. We use our new method to classify video events by segmenting video frames to important objects and main parts for extraction more accurate visual dictionary of video sources. Hiring state of the art algorithm like max-margin multiple instance learning helped us to achieve more reliable visual dictionary for each category of scenes or events.This method gain state of the art results rescpet to the other related methods including parametrics and non-parametrics on the famous indoor and outdoor scene databse like MIT 67-indoor scene, 15 category scene, UIUC 8 sports events and video event MED11 dataset
  9. Keywords:
  10. Classification ; Scene Recognition ; Nearest Neighbor ; Scene Classification ; Video Images ; Image Segmentation ; Naive Bayes Nearest Neighbor (NBNN)

 Digital Object List

 Bookmark

  • فصل 1 : مقدمه
    • 1-1 تعریف مسأله
    • 1-1 ساختار پایان‌نامه
  • فصل 2 : روش ها و الگوریتم های مرتبط
    • 2-1 ویژگی های پایه ای مورد استفاده
      • 2-1-1 ویژگی سیفت
      • 2-1-2 ویژگی هیستوگرام گرادیانهای جهت دار
      • 2-1-3 جیست
      • 2-1-4 الگوی محلی باینری
      • 2-1-5 هیستوگرام تبدیل سنسوس
    • 2-2 ادبیات موضوع: نمایش و استفاده از ویژگیها
      • 2-2-1 بسته کلمات
      • 2-2-2 هرم تطابق مکانی
    • 2-3 روشهای مرتبط دسته بندی صحنه
      • 2-3-1 روشهای مبتنی بر ویژگی
        • 2-3-1-1 روشهای مبتنی بر کوانتیزاسیون برداری
        • 2-3-1-2 دسته بندی بوسیله مناطق دلخواه
        • 2-3-1-3 دسته بندی ویدئو مبتنی بر ویژگی
      • 2-3-2 روشهای مبتنی بر توصیفهای سطح بالا
        • 2-3-2-1 روش بانک اشیاء
        • 2-3-2-2 مدل تغییرپذیر بر پایه اجزا
        • 2-3-2-3 مناطق هرمی پنهان(LPR)
        • 2-3-2-4 دسته بندی با بخشهای متمایز
        • 2-3-2-5 تشخیص صحنه ویدئو با استفاده از نمایش مفهومی
    • 2-4 نتیجه گیری فصل
  • فصل 3 -روش پیشنهادی
    • 3-1 نزدیک ترین همسایه بیز ساده (NBNN)
      • 3-1-1 تشریح الگوریتم NBNN
      • 3-1-2 هسته NBNN
      • 3-1-3 معایب NBNN
    • 3-2 الگوریتم پیشنهادی (NBNN-LLE)
      • 3-2-1 دسته لغت نامه
      • 3-2-2 بدست آوردن فواصل دقیق
      • 3-2-3 هسته NBNN-LLE
    • 3-3 ویژگیهای مورد استفاده
    • 3-4 راهکاری برای دسته بندی دقیق ویدئو
    • 3-5 نتیجهگیری فصل
  • فصل 4 - پایگاههای داده و نتایج روش پیشنهادی
    • 4-1 پایگاه داده 8 رخداد ورزشی
    • 4-2 پایگاه داده 15 دسته صحنه
    • 4-3 پایگاه داده 67 صحنه داخلی
    • 4-4 پایگاه داده تصاویر ویدئویی 15 رخداد
    • 4-5 مقایسه روشهای یادگیری لغتنامه
  • فصل 5 -جمع بندی و راهکارهای آتی
  • فهرست مراجع
...see more