Loading...
- Type of Document: M.Sc. Thesis
- Language: Farsi
- Document No: 47183 (02)
- University: Sharif University of Technology
- Department: Mathematical Sciences
- Advisor(s): Daneshgar, Amir
- Abstract:
- One of the most heatedly debated issues in Computer Science is Outlier Detection due to its vast and substantial applications such as credit cards, Image Processing,tax fraud detection, and medical approaches. Consequently, Outlier detection has been researched within various domains and knowledge disciplines. On the other hand, the research attempts have not been sufficient to overcome this critical problem considerably inasmuch as nearly all proposed techniques are associated with a special kind of applications or datasets.Firstly, this thesis attempts to provide a precise definition which not only excludes other one’s drawbacks, but also has its distinctive merits. Three essential concepts of outlier, strong-outlier, and semi-centroid outlier are taken into consideration. Fur-thermore, several key theorems concerning the recognition of outliers which are able to detect outlierness attribute precisely and deterministically are presented. Another subtle point which deserves some words here is that the problem is debated in a corresponding graph-based version.In addition to the high ability of outlier detection, these theorems and techniques can also be exploited as training data generators in supervised techniques and as threshold checkers for unsupervised algorithms
- Keywords:
- Training Dataset ; Unsupervised Method ; Centroid ; Outliers Detection ; Subpartioning ; Semi-Centroid Outlier
-
محتواي کتاب
- view
- فهرست تصاویر
- مقدمه
- داده پرت
- چالشها
- دلایل رخداد دادههای پرت
- نگاهی مختصر بر ادبیات
- کاربردها
- تشخیص تهاجمها
- تشخیص کلاهبرداری
- دادههای پزشکی و سلامت عمومی
- تشخیص آسیبهای صنعتی
- پردازش تصویر
- سایر کاربردها
- جنبههای متفاوت مساله تشخیص دادههای پرت
- داده ورودی
- نحوهی نظارت
- تکنیکهای نظارتی
- تکنیکهای نیمهنظارتی
- تکنیکهای غیرنظارتی
- انواع داده پرت
- دادههای پرت نوع سوم
- خروجی تکنیکهای تشخیص داده پرت
- تکنیکهای برچسبگذاری
- تکنیکهای نمرهدهی
- تکنیکهای متفاوت تشخیص دادههای پرت
- روشهای براساس خوشهبندی
- سایر روشهای تشخیص دادههای پرت
- روشهای براساس طبقه بندی
- تکنیکهای براساس نزدیکترین همسایه
- روشهای براساس تکنیکهای آماری
- روشهای براساس نظریه اطلاعات
- روشهای براساس تجزیه طیفی
- نتایج
- مفاهیم و تعریفهای اولیه
- تعریف داده پرت
- سایر تعاریف
- معایب سایر تعریفها و روشها
- تعریف پیشنهادی و مزایای آن
- روشها
- روشهای تشخیص دادههای پرت و دادههای پرت قوی
- روشهای تشخیص دادههای پرت شبه مرکز ثقل
- سایر روشها
- ایدههای پیشنهادی و تحقیقات آتی
- مراجع
- واژهنامه فارسی به انگلیسی و نمایه
- چکیده انگلیسی