Loading...

Modeling Persian Language in the Framework of Complex Networks

Sabooni Aghdam, Amir Mahdi | 2016

608 Viewed
  1. Type of Document: M.Sc. Thesis
  2. Language: Farsi
  3. Document No: 48110 (31)
  4. University: Sharif University of Technology
  5. Department: Languages and Linguistics Center
  6. Advisor(s): Bahrani, Mohammad
  7. Abstract:
  8. The interest in analyzing human language with complex networks is on the rise in recent years and a considerable body of research in this area has already been accumulated.However unfortunately, the use of applications of complex networks in Persian Linguistics research is missing. With the goal of introducing complex networks and their applications in this field, two of these applications have been studied in this research. First, we tried to build an inclusive network model, considering two levels of Syntax and Word Cooccurrence, for the Persian Language and provide Linguistics interpretations for them. In addition, by comparing co-occurrence networks of different languages, garnered from parallel corpus of Quran Translations, we examined the possibility of Clustering languages using word co-occurrence networks. The results indicates that this method is successful in clustering languages as the clustering results were acceptable. This shows that the properties of these networks are a reflection of the corresponding languages. Second, as an experiment, considering the shortcomings of n-gram language model, as a result of disregarding long range dependencies in language modeling, we tried to build a new language model using complex networks framework. Also for evaluating this model, we used the measure of Motifs and compared them within real and generated text. The results show the generated text with the new model outperform the text generated from n-gram model by at least 20 percent in motif signature
  9. Keywords:
  10. Complex Network ; Language Model ; Language Network ; Language Clustering ; Collocation Network

 Digital Object List

 Bookmark

  • فصل نخست: پیشگفتار
    • ۱-۱ مقدمه
    • ۲-۱ هدف پژوهش
    • 3-1 تعریف پژوهش
    • ۴-۱ ساختار پژوهش
  • فصل دوم: ادبیات پژوهش
    • ۱-۲ مقدمه
    • ۲-۲ مبانی نظریهٔ گراف
    • ۳-۲ گراف‌های تصادفی
    • ۴-۲ شبکه‌های پیچیده
    • ۵-۲ توصیف‌گر‌های شبکه پیچیده
      • ۱-۵-۲ درجه و توزیع درجه
      • ۲-۵-۲ کوتاه‌ترین مسیر و کمر گراف
      • ۳-۵-۲ ضریب خوشه‌بندی
      • ۴-۵-۲ معیار مرکزیت
        • ۱-۴-۵-۲ درمیانی
        • ۲-۴-۵-۲ مرکزیت بردار ویژه
    • ۶-۲ مدل‌های شبکه
      • ۱-۶-۲ گراف‌های منتظم
      • ۲-۶-۲ گراف‌های تصادفی
        • ۱-۲-۶-۲ مدل اِردوش – رنیی
        • ۲-۲-۶-۲ مدل شبکهٔ دنیای کوچکi واتس-اشتروگاتزii
      • ۳-۶-۲ شبکه‌های بی‌مقیاس
    • ۷-2 جمع‌بندی و نتیجه‌گیری
  • فصل سوم: پیشینهٔ پژوهش
    • ۱-۳ مقدمه
    • ۲-۳ شبکه‌ها و ساختار زبان
      • ۱-۲-۳ شبکه‌های واژگانی
        • ۱-۱-۲-۳ شبکه‌های بر اساس شباهت واجی
        • ۲-۱-۲-۳ شبکه‌های براساس شباهت معنایی
      • ۲-۲-۳ شبکه‌های واجی
        • شبکهٔ آواهای گفتار انسان
      • ۳-۲-۳ شبکه‌های هم‌نشینی واژگان
        • ۱-۳-۲-۳ شبکه‌های باهم‌آیی
        • ۲-۳-۲-۳ شبکهٔ وابستگی نحوی
    • ۳-۳ کاربردها در NLP
      • ۱-۳-۳ استنتاج طبقهٔ نحوی و معناییi
      • ۲-۳-۳رفع ابهام معنایی واژگانi
      • ۳-۳-۳ دیگر کاربردها
    • ۴-۳ جمع‌بندی و نتیجه‌گیری
  • فصل چهارم: ساخت شبکهٔ زبانی، تفسیر و کاربرد
    • ۱-۴ مقدمه
    • ۲-۴ ساخت شبکه‌های زبانی
      • ۱-۲-۴ مقدمه
      • ۲-۲-۴ روش ساخت و داده‌ها
      • ۳-۲-۴ نتایج و توضیحات
        • ۱-۳-۲-۴ درجهٔ رأس و والانس
        • ۲-۳-۲-۴ دنیای کوچک و بی‌مقیاسی
          • ساختار دنیای کوچک
          • توزیع درجهٔ بی‌مقیاس
          • آسانی حرکت در شبکه‌ها
          • مرکزیت شبکه: اهمیت نسبی هاب‌ها
      • 4-2-4 جمع‌بندی و نتیجه‌گیری
    • ۳-۴ خوشه‌بندی زبان با شبکهٔ هم‌آیی واژگان
      • ۱-۳-۴ مقدمه
      • ۲-۳-۴ پیشینه پژوهش
      • ۳-۳-۴ روش کار
      • ۴-۳-۴ نتایج و ارزیابی
      • ۵-۳-۴ جمع‌بندی و نتیجه‌گیری
  • فصل پنجم: ساخت مدل زبانی
    • ۱-۵ مقدمه
    • ۲-۵ مدل n-گرم، ضعف‌ها و قوت‌ها
    • ۳-۵ پژوهش‌های پیشین
    • 4-5 انگیزهٔ پژوهش
    • ۵-۵ روش کار
      • ۱-۵-۵ داده‌ها و مقدمات کار
        • ۱-۱-۵-۵ پیکرهٔ زبانی
        • ۲-۱-۵-۵ استخراج n-گرم‌ها
      • ۲-۵-۵ ساخت شبکه
        • ۱-۲-۵-۵ اندازهٔ شبکه
        • ۲-۲-۵-۵ بافت باهم‌آیی
        • ۳-۲-۵-۵ آستانهٔ معنی‌داری
        • ۳-۵-۵ استخراج هم‌آیی‌ها
      • ۴-۵-۵ یافتن باهم‌آیی‌ها
        • ۱-۴-۵-۵ بسامد خام
        • ۲-۴-۵-۵ آزمایش نظریه
        • ۳-۴-۵-۵ اطلاعات متقابلiii
      • ۵-۵-۵ ساخت مدل
      • ۶-۵-۵ تولید متن
    • ۶-۵ نتایج و ارزیابی
      • 1-6-5 آنالیز شبکه
        • ۱-۱-6-5 انتقال‌پذیری
        • ۲-۱-6-5 آنالیز موتیف
      • ۲-6-5 روش ارزیابی
      • ۳-۶-۵ نتایج
    • ۷-۵ جمع‌بندی و نتیجه‌گیری
  • فصل ششم: نتیجه‌گیری و کارهای آینده
    • ۱-۶ جمع‌بندی
    • ۲-۶ نوآوری‌های این پژوهش
    • ۳-۶ پژوهش‌های آینده
  • منابع و مأخذ
...see more