Loading...

Graph-Based Outlier Detection

Noori Zehmakan, Abdolahad | 2015

1990 Viewed
  1. Type of Document: M.Sc. Thesis
  2. Language: Farsi
  3. Document No: 47183 (02)
  4. University: Sharif University of Technology
  5. Department: Mathematical Sciences
  6. Advisor(s): Daneshgar, Amir
  7. Abstract:
  8. One of the most heatedly debated issues in Computer Science is Outlier Detection due to its vast and substantial applications such as credit cards, Image Processing,tax fraud detection, and medical approaches. Consequently, Outlier detection has been researched within various domains and knowledge disciplines. On the other hand, the research attempts have not been sufficient to overcome this critical problem considerably inasmuch as nearly all proposed techniques are associated with a special kind of applications or datasets.Firstly, this thesis attempts to provide a precise definition which not only excludes other one’s drawbacks, but also has its distinctive merits. Three essential concepts of outlier, strong-outlier, and semi-centroid outlier are taken into consideration. Fur-thermore, several key theorems concerning the recognition of outliers which are able to detect outlierness attribute precisely and deterministically are presented. Another subtle point which deserves some words here is that the problem is debated in a corresponding graph-based version.In addition to the high ability of outlier detection, these theorems and techniques can also be exploited as training data generators in supervised techniques and as threshold checkers for unsupervised algorithms
  9. Keywords:
  10. Training Dataset ; Unsupervised Method ; Centroid ; Outliers Detection ; Subpartioning ; Semi-Centroid Outlier

 Digital Object List

 Bookmark

  • فهرست تصاویر
  • مقدمه
    • داده پرت
    • چالش‌ها
    • دلایل رخ‌داد داده‌های پرت
    • نگاهی مختصر بر ادبیات
    • کاربردها
      • تشخیص تهاجم‌ها
      • تشخیص کلاه‌برداری
      • داده‌های پزشکی و سلامت عمومی
      • تشخیص آسیب‌های صنعتی
      • پردازش تصویر
      • سایر کاربردها
  • جنبه‌های متفاوت مساله تشخیص داده‌های پرت
    • داده ورودی
    • نحوه‌ی نظارت
      • تکنیک‌های نظارتی
      • تکنیک‌های نیمه‌نظارتی
      • تکنیک‌های غیرنظارتی
    • انواع داده پرت
      • داده‌های پرت نوع سوم
    • خروجی تکنیک‌های تشخیص داده پرت
      • تکنیک‌های برچسب‌گذاری
      • تکنیک‌های نمره‌دهی
  • تکنیک‌های متفاوت تشخیص داده‌های پرت
    • روش‌های براساس خوشه‌بندی
    • سایر روش‌های تشخیص داده‌های پرت
      • روش‌های براساس طبقه بندی
      • تکنیک‌های براساس نزدیک‌ترین همسایه
      • روش‌های براساس تکنیک‌های آماری
      • روش‌های براساس نظریه اطلاعات
      • روش‌های براساس تجزیه طیفی
  • نتایج
    • مفاهیم و تعریف‌های اولیه
    • تعریف داده پرت
      • سایر تعاریف
      • معایب سایر تعریف‌ها و روش‌ها
      • تعریف پیشنهادی و مزایای آن
    • روش‌ها
      • روش‌های تشخیص داده‌های پرت و داده‌های پرت قوی
      • روش‌های تشخیص داده‌های پرت شبه مرکز ثقل
      • سایر روش‌ها
      • ایده‌های پیشنهادی و تحقیقات آتی
  • مراجع
  • واژه‌نامه فارسی به انگلیسی و نمایه
  • چکیده انگلیسی
...see more