Loading...
- Type of Document: Ph.D. Dissertation
- Language: Farsi
- Document No: 43636 (19)
- University: Sharif University of Technology
- Department: Computer Engineering
- Advisor(s): Rabiei, Hamid Reza
- Abstract:
- Many real-world communication systems such as Internet, online social networks, and brain networks can be modeled as a complex network of interacting dynamical nodes. These networks have non-trivial topological features, i.e., features that do not occur in simple networks such as lattices or random networks. The tremendous growth of Internet and its applications in recent years has resulted in creation of large-scale complex networks involving tens or hundreds of millions of nodes and links. Thus, it may be impossible or costly to obtain a complete picture of these large networks, and sampling methods are essential for practical estimation of network properties. Therefore, in this thesis, we focus on the use of sampling to estimate network properties from incomplete (sampled) data.In the first part, we propose a framework to measure nodal characteristics in an arbitrary directed network. To this end, we introduce a personalized PageRank-based algorithm to sample nodes. Comprehensive theoretical and empirical analysis demonstrates that it is nearly unbiased even in situations where stationary distribu-tion of PageRank is poorly approximated. In the second part, we propose a novel link-tracing algorithm that considers community structures in the process of network sampling. Empirical studies on several synthetic and real-world networks show that the proposed method improves the performance of network sampling compared to the popular link-based sampling methods in terms of accuracy and visited commu-nities. In the third part, we propose a diffusion-aware sampling method which uses the infection times (as local information) to explore an information diffusion net-work. Our empirical analysis demonstrates that in average, the proposed framework outperforms the common sampling methods in terms of link-based characteristics
- Keywords:
- Complex Network ; Social Networks ; Emission ; Sampling ; Estimating
-
محتواي پايان نامه
- view
- مقدمه
- فرآیند اندازهگیری ویژگیهای شبکه
- نمونهبرداری
- تخمین
- تعریف مساله
- اهمیت موضوع و کاربردهای آن
- دستاوردهای این رساله
- ساختار رساله
- فرآیند اندازهگیری ویژگیهای شبکه
- فرآیند اندازهگیری ویژگیهای شبکه با رویکرد مبتنی بر طراحی
- تخمینزننده هرویتز-تامسون
- تحلیل نظری روشهای وفقی نمونهبرداری: امکان محاسبه احتمال ملاقات عناصر شبکه
- تصادفی ساده
- جستجوی سطح اول
- قدمزنی تصادفی
- تحلیل تجربی روشهای نمونهبرداری: استخراج ویژگیهای ساختاری و رفتاری شبکه توئیتر
- مجموعه داده جمع آوری شده
- توزیع درجه ورودی و خروجی گرههای شبکه
- نرخ دنبالگرها به دنبالشوندهها
- همبستگی مابین تعداد دنبالگرهای یک کاربر و توئیتهای ارسالی توسط آن
- همبستگی مابین تعداد دنبالشوندههای یک کاربر و توئیتهای ارسالی توسط آن
- جمع بندی
- اندازهگیری ویژگیهای مرتبط با گره در شبکههای جهتدار
- مقدمه
- مفاهیم اولیه
- تعاریف پایه
- تعریف مساله نمونهبرداری از شبکههای جهتدار
- نمونهبرداری اهمیت
- بردار رتبهصفحه شخصی شده
- چارچوب اندازهگیری پیشنهادی برای شبکههای جهتدار
- ارزیابی چارچوب پیشنهادی
- مجموعه داده
- تابع هدف مورد آزمون
- سناریوهای ارزیابی
- نتایج ارزیابی چارچوب پیشنهادی
- جمع بندی
- اندازهگیری ویژگیهای شبکههای متشکل از چندین خوشه
- مقدمه
- پیشینه موضوع
- مفاهیم اولیه
- تعاریف اولیه
- تعریف مساله نمونهبرداری از شبکه با توجه به ساختار خوشه
- تقریب بردارهای رتبهصفحه شخصی شده
- تصحیح اریب
- روش پیشنهادی
- ارزیابی تجربی روش پیشنهادی
- مجموعه داده آزمون
- پیکربندی بستر شبیهسازی
- نتایج ارزیابی
- جمع بندی
- نمونهبرداری و تخمین در شبکههای انتشار اطلاعات
- مقدمه
- پیشینه موضوع
- مفاهیم پایه
- تعاریف اولیه
- تعریف مساله
- چارچوب پیشنهادی
- روش نمونهبرداری پیشنهادی
- رویکرد تخمین
- ارزیابی تجربی
- پیکربندی سناریوی شبیهسازی
- مجموعه داده آزمون
- سرعت آبشار
- ارزیابی کارایی
- تحلیل رفتار فرآیند انتشار
- جمعبندی
- نتیجه گیری
- جمع بندی
- حوزه های تحقیقاتی پیشنهادی برای کارهای آتی
- مراجع
- واژهنامه انگلیسی به فارسی
- واژهنامه فارسی به انگلیسی
- اختصارات
- نمایه