Loading...
- Type of Document: Ph.D. Dissertation
- Language: Farsi
- Document No: 58392 (19)
- University: Sharif University of Technology
- Department: Computer Engineering
- Advisor(s): Beigy, Hamid; Abam, Mohammad Ali
- Abstract:
- In many real-world problems, graphlets in graph theory and simplets in simplicial complexes (SCs) are essential building blocks for analyzing topological structures. Graphlet analysis, which involves calculating the frequency distributions of graphlets, poses significant challenges in large networks. Two crucial concepts in this context are the graphlet frequency distribution (GFD) vector for entire networks and the graphlet degree vector (GDV) for individual nodes. Although previous studies have attempted to approximate the GFD and GDV, little attention has been given to determining the required sample complexity to achieve specific error bounds and confidence levels. This article addresses this gap by investigating the sample complexity needed to approximate the GFD and GDV using sampling-based algorithms accurately. We provide upper bounds for their sample complexity and extend our findings to graphlet degree centrality (GDC). We propose algorithms for identifying the top $k$ most frequent graphlet types and the $k$ topologically central vertices in networks. Similarly, simplets—the fundamental components of SCs—play a crucial role in understanding the structure of SCs. While prior research has mainly focused on counting or approximating the number of simplets, analyzing their frequency distribution is more practical for large-scale SCs. This article introduces the Simplet Frequency Distribution (SFD) vector, which facilitates the analysis of simplet frequencies within SCs. We also present a method for approximating the SFD vector using uniform sampling-based algorithms, establishing bounds on the sample complexity required for accurate approximation. Additionally, we extend the concept of simplet frequency distribution to simplices by introducing the Simplet Degree Vector (SDV) and Simplet Degree Centrality (SDC) for every simplex in SCs. We provide bounds for the sample complexity necessary to approximate the SDV and SDC and demonstrate the effectiveness of our methods through algorithms for approximating the SFD, geometric SFD, SDV, and SDC. The theoretical results are validated through experiments on both random and real-world networks and SCs, showing that the number of required samples is independent of the size of the underlying structure
- Keywords:
- Graphlet-Based Method ; Graphlet Degree Centrality (GDC) ; Graphlet Degree Vector (GDV) ; Simplet Degree Vector (SDV) ; Simplet ; Simplet Frequency Distribution (SFD) ; Graphlet Frequency Distribution (GFD) ; Simplet Degree Centrality (SDC)
-
محتواي کتاب
- view
- مقدمه
- کاربردهای تحلیل شبکه از طریق ریزنقشها
- تعریف صورت مسئله
- اهداف رساله و دستاوردها
- کارکردهای تئوری و عملی رساله
- ساختار رساله
- پیشزمینه
- گراف
- مجتمع سادکی
- ریزگراف
- ریزسادهگان
- امضای ساختاری
- بردار توزیع فراوانی ریزگرافها
- بردار توزیع فراوانی ریزگرافها برای رئوس گراف
- بردار درجهای ریزگرافها
- بردار توزیع فراوانی ریزسادهگان
- بردار درجهای ریزسادهگان
- مرکزیت درجهای
- بعد VC
- تقریب
- رابطه بعد vc و تقریب اپسیلن-دلتا
- جمع بندی
- پژوهشهای پیشین
- کاربردهای ریزنقشها در ابرگرافها
- شمارش ریزگرافها
- شمارش ریزسادهگان
- جمعبندی
- امضای ساختاری ریزگراف و ریزسادهگان
- تقریب امضای ساختاری ریزگراف
- بعد VC ریزگرافها
- پیچیدگی نمونه تقریب بردار توزیع فراوانی ریزگراف
- تقریب ریزگرافهای پرتکرار
- امضای ساختاری گرافهای جهتدار
- تقریب امضای ساختاری ریزسادهگان
- پیچیدگی نمونه تقریب بردار توزیع فراوانی ریزسادهگان
- الگوریتم نمونهبرداری یکنواخت ریزسادهگان
- الگوریتم تقریب بردار توزیع فراوانی ریزسادهگان
- تحلیل پیچیدگی الگوریتم تقریب بردار توزیع فراوانی ریزسادهگان
- الگوریتم FAS تقریب اپسیلون-دلتای سریع بردار توزیع فراوانی ریزسادگان
- مقایسه با روشهای موجود
- تقریب امضای ساختاری ریزسادهگان در فضای هندسی
- جمع بندی
- تقریب امضای ساختاری ریزگراف
- امضای ساختاری برای رئوس و سادکها
- امضای ساختاری ریزگراف برای رئوس
- تقریب بردار GFD رئوس
- تقریب بردار درجهای ریزگراف رئوس
- امضای ساختاری ریزسادهگان برای سادکها
- پیچیدگی نمونه تقریب بردار درجه ریزسادگان سادکها
- الگوریتم تقریب اپسیلون-دلتای بردار درجه ریزسادهگان
- جمع بندی
- امضای ساختاری ریزگراف برای رئوس
- مرکزیت درجهای ریزگراف و ریزسادهگان
- مرکزیت درجهای ریزگراف برای رئوس
- تقریب مرکزیت درجهای ریزگراف
- مرکزهای برتر درجهای ریزگراف
- مرکزیت درجهای ریزسادهگان برای سادکها
- تقریب مرکزیت درجهای ریزسادهگان
- مرکزهای برتر درجهای ریزسادهگان
- جمع بندی
- مرکزیت درجهای ریزگراف برای رئوس
- مطالعه موردی و ارزیابیهای تجربی
- مطالعه موردی
- مرکزیّت و مجموعههای اقلام مکرر کلیدی
- شبکههای همنویسندگی
- ارزیابیهای تجربی پیچیدگی نمونهگیری
- پیادهسازی
- رابطه بین تعداد نمونه و اندازه شبکه در گراف
- رابطه بین تعداد نمونه و اطمینان
- رابطه بین تعداد نمونه، خطا و اطمینان در مجتمعهای سادکی
- ارزیابی زمان اجرای الگوریتم FAS
- جمع بندی
- مطالعه موردی
- جمعبندی و نتیجهگیری
- مراجع
- واژهنامه
