Loading...

Structural Analysis of Networks Using Network Motifs

Mahini, Mohammad | 2025

0 Viewed
  1. Type of Document: Ph.D. Dissertation
  2. Language: Farsi
  3. Document No: 58392 (19)
  4. University: Sharif University of Technology
  5. Department: Computer Engineering
  6. Advisor(s): Beigy, Hamid; Abam, Mohammad Ali
  7. Abstract:
  8. In many real-world problems, graphlets in graph theory and simplets in simplicial complexes (SCs) are essential building blocks for analyzing topological structures. Graphlet analysis, which involves calculating the frequency distributions of graphlets, poses significant challenges in large networks. Two crucial concepts in this context are the graphlet frequency distribution (GFD) vector for entire networks and the graphlet degree vector (GDV) for individual nodes. Although previous studies have attempted to approximate the GFD and GDV, little attention has been given to determining the required sample complexity to achieve specific error bounds and confidence levels. This article addresses this gap by investigating the sample complexity needed to approximate the GFD and GDV using sampling-based algorithms accurately. We provide upper bounds for their sample complexity and extend our findings to graphlet degree centrality (GDC). We propose algorithms for identifying the top $k$ most frequent graphlet types and the $k$ topologically central vertices in networks. Similarly, simplets—the fundamental components of SCs—play a crucial role in understanding the structure of SCs. While prior research has mainly focused on counting or approximating the number of simplets, analyzing their frequency distribution is more practical for large-scale SCs. This article introduces the Simplet Frequency Distribution (SFD) vector, which facilitates the analysis of simplet frequencies within SCs. We also present a method for approximating the SFD vector using uniform sampling-based algorithms, establishing bounds on the sample complexity required for accurate approximation. Additionally, we extend the concept of simplet frequency distribution to simplices by introducing the Simplet Degree Vector (SDV) and Simplet Degree Centrality (SDC) for every simplex in SCs. We provide bounds for the sample complexity necessary to approximate the SDV and SDC and demonstrate the effectiveness of our methods through algorithms for approximating the SFD, geometric SFD, SDV, and SDC. The theoretical results are validated through experiments on both random and real-world networks and SCs, showing that the number of required samples is independent of the size of the underlying structure
  9. Keywords:
  10. Graphlet-Based Method ; Graphlet Degree Centrality (GDC) ; Graphlet Degree Vector (GDV) ; Simplet Degree Vector (SDV) ; Simplet ; Simplet Frequency Distribution (SFD) ; Graphlet Frequency Distribution (GFD) ; Simplet Degree Centrality (SDC)

 Digital Object List

 Bookmark

  • مقدمه
    • کاربردهای تحلیل شبکه از طریق ریزنقش‌ها
    • تعریف صورت مسئله
    • اهداف رساله و دستاوردها
    • کارکردهای تئوری و عملی رساله
    • ساختار رساله
  • پیش‌زمینه
    • گراف
    • مجتمع سادکی
    • ریزگراف
    • ‌ریزساده‌گان
    • امضای ساختاری
      • بردار توزیع فراوانی ریزگراف‌ها
      • بردار توزیع فراوانی ریزگراف‌ها برای رئوس گراف
      • بردار درجه‌ای ریزگراف‌ها
      • بردار توزیع فراوانی ریزساده‌گان
      • بردار درجه‌ای ریزساده‌گان
    • مرکزیت درجه‌ای
    • بعد VC
    • تقریب
    • رابطه بعد vc و تقریب اپسیلن-دلتا
    • جمع بندی
  • پژوهش‌های پیشین
    • کاربردهای ریزنقش‌ها در ابرگراف‌ها
    • شمارش ریزگراف‌ها
    • شمارش ریزساده‌گان
    • جمع‌بندی
  • امضای ساختاری ریزگراف و ریزساده‌گان
    • تقریب امضای ساختاری ریزگراف
      • بعد VC ریزگراف‌ها
      • پیچیدگی نمونه تقریب بردار توزیع فراوانی ریزگراف
      • تقریب ریزگراف‌های پرتکرار
    • امضای ساختاری گراف‌های جهت‌دار
    • تقریب امضای ساختاری ریزساده‌گان
      • پیچیدگی نمونه تقریب بردار توزیع فراوانی ریزساده‌گان
      • الگوریتم نمونه‌برداری یکنواخت ریزساده‌گان
      • الگوریتم تقریب بردار توزیع فراوانی ریزساده‌گان
      • تحلیل پیچیدگی الگوریتم تقریب بردار توزیع فراوانی ریزساده‌گان
      • الگوریتم FAS تقریب اپسیلون-دلتای سریع بردار توزیع فراوانی ریزسادگان
      • مقایسه با روش‌های موجود
    • تقریب امضای ساختاری ریزساده‌گان در فضای هندسی
    • جمع بندی
  • امضای ساختاری برای رئوس و سادک‌ها
    • امضای ساختاری ریزگراف برای رئوس
      • تقریب بردار GFD رئوس
      • تقریب بردار درجه‌ای ریزگراف رئوس
    • امضای ساختاری ریزساده‌گان برای سادک‌ها
      • پیچیدگی نمونه تقریب بردار درجه ریزسادگان سادک‌ها
      • الگوریتم تقریب اپسیلون-دلتای بردار درجه ریزساده‌گان
    • جمع بندی
  • مرکزیت درجه‌ای ریزگراف و ریزساده‌گان
    • مرکزیت درجه‌ای ریزگراف برای رئوس
      • تقریب مرکزیت درجه‌ای ریزگراف
      • مرکزهای برتر درجه‌ای ریزگراف
    • مرکزیت درجه‌ای ریزساده‌گان برای سادک‌ها
      • تقریب مرکزیت درجه‌ای ریزساده‌گان
      • مرکزهای برتر درجه‌ای ریزساده‌گان
    • جمع بندی
  • مطالعه موردی و ارزیابی‌های تجربی
    • مطالعه موردی
      • مرکزیّت و مجموعه‌های اقلام مکرر کلیدی
      • شبکه‌های هم‌نویسندگی
    • ارزیابی‌های تجربی پیچیدگی نمونه‌گیری
      • پیاده‌سازی
      • رابطه بین تعداد نمونه و اندازه شبکه در گراف
      • رابطه بین تعداد نمونه و اطمینان
      • رابطه بین تعداد نمونه، خطا و اطمینان در مجتمع‌های سادکی
    • ارزیابی‌ زمان اجرای الگوریتم FAS
    • جمع بندی
  • جمع‌بندی و نتیجه‌گیری
  • مراجع
  • واژه‌نامه
...see more