Loading...

Online High-bandwidth Network Application Detection Using Stream Classification

Nazari, Ziaeddin | 2019

1563 Viewed
  1. Type of Document: M.Sc. Thesis
  2. Language: Farsi
  3. Document No: 51903 (19)
  4. University: Sharif University of Technology
  5. Department: Computer Engineering
  6. Advisor(s): Jalili, Rasool
  7. Abstract:
  8. Trac classication in today’s high-bandwidth networks is challenging, resource consuming, and inaccurate due to the high volume, velocity, and variety aracteristics of the network trac. Trac aracterization and Application identication teniques are widely addressed in the current literature. Due to the massive volume and streaming data in recent years, stream algorithms have been considered by many researers in dierent areas. Online application detection is an issue that has been addressed less frequently in literature. In this thesis, we investigate the performance of 10 dierent stream classication algorithms along with traditional classication algorithms. To generate a robust classier for identifying applications over encrypted trac, we proposed DSCA as a DPI-based Stream Classication Algorithm. DSCA utilizes applications detected by DPI as labels for incoming trac ow. Accordingly, the classi cation models are adapted to consider new labeled data. To reduce the classication algorithms overhead without accuracy reduction, DSCA uses a feature selection method, named CfsSubsetEval. DSCA is applied on UNB ISCX VPN-nonVPN dataset and UNB ISCX Tor-nonTor dataset via MOA tool. e simulation results show that the DSCA with Adaptive Random Forest stream classication approa has the best performance over UNB ISCX VPN-nonVPN whi processed the dataset in 8.63 seconds with 96.75%. About UNB ISCX Tor-nonTor dataset, DSCA with Knn with PAW classication approa has the best performance (86.92% accuracy and 12 seconds execution time)
  9. Keywords:
  10. Network Traffic ; Data Stream Classification ; Application Identification ; Incremental Learning ; Traffic Analysis ; Online Detection

 Digital Object List

 Bookmark

  • 1 مقدمه
    • 1.1 تعریف مسئله
    • 1.2 اهداف پایان‌نامه
    • 1.3 ساختار پایان‌نامه
  • 2 مفاهیم پایه
    • 2.1 تعاریف پایه
    • 2.2 ویژگی‌های دسته‌بند ترافیک شبکه
    • 2.3 روش‌های دسته‌بندی ترافیک شبکه
      • 2.3.1 دسته‌بندی مبتنی بر درگاه
      • 2.3.2 دسته‌بندی مبتنی بر بدنه بسته
      • 2.3.3 دسته‌بندی مبتنی بر ویژگی‌های آماری
      • 2.3.4 دسته‌بندی رفتاری‌‌
    • 2.4 دسته‌بندی جویبار
      • 2.4.1 تعریف جویبار داده
      • 2.4.2 ویژگی‌های اصلی جویبار
      • 2.4.3 نیازمندی‌های دسته‌بندی در جویبار
      • 2.4.4 یادگیری در محیط جویبار
      • 2.4.5 تعریف دسته‌بندی جویبار داده
    • 2.5 ارزیابی دسته‌بند جویبار
      • 2.5.1 روش هُلداَوت
      • 2.5.2 روش آزمایش-سپس-آموزش
      • 2.5.3 روش پریکوئنشال
    • 2.6 رانش مفهوم
      • 2.6.1 تعریف
      • 2.6.2 انواع رانش مجازی
      • 2.6.3 رویکردهای مقابله با رانش مفهوم
      • 2.6.4 رویکرد فعال
    • 2.7 گروه‌بندی الگوریتم‌های دسته‌بندی جویبار
      • 2.7.1 تک دسته‌بند
      • 2.7.2 گردایه
    • 2.8 جمع‌بندی
  • 3 پژوهش‌های پیشین
    • 3.1 ملاک حقیقت غیرخودکار
    • 3.2 ملاک حقیقت خودکار
    • 3.3 کاستی پژوهش‌های گذشته
    • 3.4 جمع‌بندی
  • 4 روش پیشنهادی
    • 4.1 چارچوب روش پیشنهادی
      • 4.1.1 استخراج‌گر ویژگی
      • 4.1.2 برچسب‌زن خودکار
      • 4.1.3 پردازش‌گر جویبار
      • 4.1.4 دسته‌بند جویبار
      • 4.1.5 نوآوری‌ها
      • 4.1.6 شرح اجرای راه‌کار پیشنهادی
    • 4.2 جایگاه روش پیشنهادی در معماری شبکه
    • 4.3 جمع‌بندی
  • 5 پیاده‌سازی و ارزیابی راهکار پیشنهادی
    • 5.1 پیاده‌سازی
      • 5.1.1 ابزار سیس‌فِلومِتِر
      • 5.1.2 ابزار nDPI
      • 5.1.3 ابزار وِکا
      • 5.1.4 ابزار موآ
    • 5.2 مجموعه دادگان
    • 5.3 معیارهای ارزیابی
    • 5.4 انتخاب ویژگی
    • 5.5 نتایج ارزیابی
    • 5.6 مقایسه چارچوب پیشنهادی با پژوهش‌های پیشین
    • 5.7 مقایسه نتایج با نسبت‌های مختلف داده آموزش و آزمایش
    • 5.8 جمع‌بندی
  • 6 جمع‌بندی و سوی کارهای آتی
  • کتاب‌نامه
  • واژه‌نامه‌ی فارسی به انگلیسی
  • واژه‌نامه‌ی انگلیسی به فارسی
...see more