Loading...
Online High-bandwidth Network Application Detection Using Stream Classification
Nazari, Ziaeddin | 2019
1563
Viewed
- Type of Document: M.Sc. Thesis
- Language: Farsi
- Document No: 51903 (19)
- University: Sharif University of Technology
- Department: Computer Engineering
- Advisor(s): Jalili, Rasool
- Abstract:
- Trac classication in today’s high-bandwidth networks is challenging, resource consuming, and inaccurate due to the high volume, velocity, and variety aracteristics of the network trac. Trac aracterization and Application identication teniques are widely addressed in the current literature. Due to the massive volume and streaming data in recent years, stream algorithms have been considered by many researers in dierent areas. Online application detection is an issue that has been addressed less frequently in literature. In this thesis, we investigate the performance of 10 dierent stream classication algorithms along with traditional classication algorithms. To generate a robust classier for identifying applications over encrypted trac, we proposed DSCA as a DPI-based Stream Classication Algorithm. DSCA utilizes applications detected by DPI as labels for incoming trac ow. Accordingly, the classi cation models are adapted to consider new labeled data. To reduce the classication algorithms overhead without accuracy reduction, DSCA uses a feature selection method, named CfsSubsetEval. DSCA is applied on UNB ISCX VPN-nonVPN dataset and UNB ISCX Tor-nonTor dataset via MOA tool. e simulation results show that the DSCA with Adaptive Random Forest stream classication approa has the best performance over UNB ISCX VPN-nonVPN whi processed the dataset in 8.63 seconds with 96.75%. About UNB ISCX Tor-nonTor dataset, DSCA with Knn with PAW classication approa has the best performance (86.92% accuracy and 12 seconds execution time)
- Keywords:
- Network Traffic ; Data Stream Classification ; Application Identification ; Incremental Learning ; Traffic Analysis ; Online Detection
-
محتواي کتاب
- view
- 1 مقدمه
- 1.1 تعریف مسئله
- 1.2 اهداف پایاننامه
- 1.3 ساختار پایاننامه
- 2 مفاهیم پایه
- 2.1 تعاریف پایه
- 2.2 ویژگیهای دستهبند ترافیک شبکه
- 2.3 روشهای دستهبندی ترافیک شبکه
- 2.3.1 دستهبندی مبتنی بر درگاه
- 2.3.2 دستهبندی مبتنی بر بدنه بسته
- 2.3.3 دستهبندی مبتنی بر ویژگیهای آماری
- 2.3.4 دستهبندی رفتاری
- 2.4 دستهبندی جویبار
- 2.4.1 تعریف جویبار داده
- 2.4.2 ویژگیهای اصلی جویبار
- 2.4.3 نیازمندیهای دستهبندی در جویبار
- 2.4.4 یادگیری در محیط جویبار
- 2.4.5 تعریف دستهبندی جویبار داده
- 2.5 ارزیابی دستهبند جویبار
- 2.5.1 روش هُلداَوت
- 2.5.2 روش آزمایش-سپس-آموزش
- 2.5.3 روش پریکوئنشال
- 2.6 رانش مفهوم
- 2.6.1 تعریف
- 2.6.2 انواع رانش مجازی
- 2.6.3 رویکردهای مقابله با رانش مفهوم
- 2.6.4 رویکرد فعال
- 2.7 گروهبندی الگوریتمهای دستهبندی جویبار
- 2.7.1 تک دستهبند
- 2.7.2 گردایه
- 2.8 جمعبندی
- 3 پژوهشهای پیشین
- 3.1 ملاک حقیقت غیرخودکار
- 3.2 ملاک حقیقت خودکار
- 3.3 کاستی پژوهشهای گذشته
- 3.4 جمعبندی
- 4 روش پیشنهادی
- 4.1 چارچوب روش پیشنهادی
- 4.1.1 استخراجگر ویژگی
- 4.1.2 برچسبزن خودکار
- 4.1.3 پردازشگر جویبار
- 4.1.4 دستهبند جویبار
- 4.1.5 نوآوریها
- 4.1.6 شرح اجرای راهکار پیشنهادی
- 4.2 جایگاه روش پیشنهادی در معماری شبکه
- 4.3 جمعبندی
- 4.1 چارچوب روش پیشنهادی
- 5 پیادهسازی و ارزیابی راهکار پیشنهادی
- 5.1 پیادهسازی
- 5.1.1 ابزار سیسفِلومِتِر
- 5.1.2 ابزار nDPI
- 5.1.3 ابزار وِکا
- 5.1.4 ابزار موآ
- 5.2 مجموعه دادگان
- 5.3 معیارهای ارزیابی
- 5.4 انتخاب ویژگی
- 5.5 نتایج ارزیابی
- 5.6 مقایسه چارچوب پیشنهادی با پژوهشهای پیشین
- 5.7 مقایسه نتایج با نسبتهای مختلف داده آموزش و آزمایش
- 5.8 جمعبندی
- 5.1 پیادهسازی
- 6 جمعبندی و سوی کارهای آتی
- کتابنامه
- واژهنامهی فارسی به انگلیسی
- واژهنامهی انگلیسی به فارسی