Loading...
Modeling Persian Language in the Framework of Complex Networks
Sabooni Aghdam, Amir Mahdi | 2016
608
Viewed
- Type of Document: M.Sc. Thesis
- Language: Farsi
- Document No: 48110 (31)
- University: Sharif University of Technology
- Department: Languages and Linguistics Center
- Advisor(s): Bahrani, Mohammad
- Abstract:
- The interest in analyzing human language with complex networks is on the rise in recent years and a considerable body of research in this area has already been accumulated.However unfortunately, the use of applications of complex networks in Persian Linguistics research is missing. With the goal of introducing complex networks and their applications in this field, two of these applications have been studied in this research. First, we tried to build an inclusive network model, considering two levels of Syntax and Word Cooccurrence, for the Persian Language and provide Linguistics interpretations for them. In addition, by comparing co-occurrence networks of different languages, garnered from parallel corpus of Quran Translations, we examined the possibility of Clustering languages using word co-occurrence networks. The results indicates that this method is successful in clustering languages as the clustering results were acceptable. This shows that the properties of these networks are a reflection of the corresponding languages. Second, as an experiment, considering the shortcomings of n-gram language model, as a result of disregarding long range dependencies in language modeling, we tried to build a new language model using complex networks framework. Also for evaluating this model, we used the measure of Motifs and compared them within real and generated text. The results show the generated text with the new model outperform the text generated from n-gram model by at least 20 percent in motif signature
- Keywords:
- Complex Network ; Language Model ; Language Network ; Language Clustering ; Collocation Network
-
محتواي کتاب
- view
- فصل نخست: پیشگفتار
- ۱-۱ مقدمه
- ۲-۱ هدف پژوهش
- 3-1 تعریف پژوهش
- ۴-۱ ساختار پژوهش
- فصل دوم: ادبیات پژوهش
- ۱-۲ مقدمه
- ۲-۲ مبانی نظریهٔ گراف
- ۳-۲ گرافهای تصادفی
- ۴-۲ شبکههای پیچیده
- ۵-۲ توصیفگرهای شبکه پیچیده
- ۱-۵-۲ درجه و توزیع درجه
- ۲-۵-۲ کوتاهترین مسیر و کمر گراف
- ۳-۵-۲ ضریب خوشهبندی
- ۴-۵-۲ معیار مرکزیت
- ۱-۴-۵-۲ درمیانی
- ۲-۴-۵-۲ مرکزیت بردار ویژه
- ۶-۲ مدلهای شبکه
- ۱-۶-۲ گرافهای منتظم
- ۲-۶-۲ گرافهای تصادفی
- ۱-۲-۶-۲ مدل اِردوش – رنیی
- ۲-۲-۶-۲ مدل شبکهٔ دنیای کوچکi واتس-اشتروگاتزii
- ۳-۶-۲ شبکههای بیمقیاس
- ۷-2 جمعبندی و نتیجهگیری
- فصل سوم: پیشینهٔ پژوهش
- ۱-۳ مقدمه
- ۲-۳ شبکهها و ساختار زبان
- ۱-۲-۳ شبکههای واژگانی
- ۱-۱-۲-۳ شبکههای بر اساس شباهت واجی
- ۲-۱-۲-۳ شبکههای براساس شباهت معنایی
- ۲-۲-۳ شبکههای واجی
- شبکهٔ آواهای گفتار انسان
- ۳-۲-۳ شبکههای همنشینی واژگان
- ۱-۳-۲-۳ شبکههای باهمآیی
- ۲-۳-۲-۳ شبکهٔ وابستگی نحوی
- ۱-۲-۳ شبکههای واژگانی
- ۳-۳ کاربردها در NLP
- ۱-۳-۳ استنتاج طبقهٔ نحوی و معناییi
- ۲-۳-۳رفع ابهام معنایی واژگانi
- ۳-۳-۳ دیگر کاربردها
- ۴-۳ جمعبندی و نتیجهگیری
- فصل چهارم: ساخت شبکهٔ زبانی، تفسیر و کاربرد
- ۱-۴ مقدمه
- ۲-۴ ساخت شبکههای زبانی
- ۱-۲-۴ مقدمه
- ۲-۲-۴ روش ساخت و دادهها
- ۳-۲-۴ نتایج و توضیحات
- ۱-۳-۲-۴ درجهٔ رأس و والانس
- ۲-۳-۲-۴ دنیای کوچک و بیمقیاسی
- ساختار دنیای کوچک
- توزیع درجهٔ بیمقیاس
- آسانی حرکت در شبکهها
- مرکزیت شبکه: اهمیت نسبی هابها
- 4-2-4 جمعبندی و نتیجهگیری
- ۳-۴ خوشهبندی زبان با شبکهٔ همآیی واژگان
- ۱-۳-۴ مقدمه
- ۲-۳-۴ پیشینه پژوهش
- ۳-۳-۴ روش کار
- ۴-۳-۴ نتایج و ارزیابی
- ۵-۳-۴ جمعبندی و نتیجهگیری
- فصل پنجم: ساخت مدل زبانی
- ۱-۵ مقدمه
- ۲-۵ مدل n-گرم، ضعفها و قوتها
- ۳-۵ پژوهشهای پیشین
- 4-5 انگیزهٔ پژوهش
- ۵-۵ روش کار
- ۱-۵-۵ دادهها و مقدمات کار
- ۱-۱-۵-۵ پیکرهٔ زبانی
- ۲-۱-۵-۵ استخراج n-گرمها
- ۲-۵-۵ ساخت شبکه
- ۱-۲-۵-۵ اندازهٔ شبکه
- ۲-۲-۵-۵ بافت باهمآیی
- ۳-۲-۵-۵ آستانهٔ معنیداری
- ۳-۵-۵ استخراج همآییها
- ۴-۵-۵ یافتن باهمآییها
- ۱-۴-۵-۵ بسامد خام
- ۲-۴-۵-۵ آزمایش نظریه
- ۳-۴-۵-۵ اطلاعات متقابلiii
- ۵-۵-۵ ساخت مدل
- ۶-۵-۵ تولید متن
- ۱-۵-۵ دادهها و مقدمات کار
- ۶-۵ نتایج و ارزیابی
- 1-6-5 آنالیز شبکه
- ۱-۱-6-5 انتقالپذیری
- ۲-۱-6-5 آنالیز موتیف
- ۲-6-5 روش ارزیابی
- ۳-۶-۵ نتایج
- 1-6-5 آنالیز شبکه
- ۷-۵ جمعبندی و نتیجهگیری
- فصل ششم: نتیجهگیری و کارهای آینده
- ۱-۶ جمعبندی
- ۲-۶ نوآوریهای این پژوهش
- ۳-۶ پژوهشهای آینده
- منابع و مأخذ
