Loading...
Abstractive Persian User Reviews Summarization in the Frameworks of Graph Data Structure and Complex Networks
Bazargan, Sara | 2016
1034
Viewed
- Type of Document: M.Sc. Thesis
- Language: Farsi
- Document No: 49359 (31)
- University: Sharif University of Technology
- Department: Languages and Linguistics Center
- Advisor(s): Khosravizadeh, Parvaneh
- Abstract:
- With the rapid development in information-communication technologies a huge amount of electronic documents has been produced and increase everyday in the world wide web. According to this wide information environment, summarization is critical for the users who digest this electronic big data. This research proposes two graph-based abstractive models for summarizing the Persian texts. A good summary should cover the overall context and the important subjects, and should be properly readable and coherent as well. Some permanent challenges in automatic text summarizations intended to increase the readability of output text, as well as covering all the main topics, and minimize the redundancy. In the suggested approaches, graph is constructed by the words of the input text and so it’s large in size. Then the output summary generated according to this graph’ properties. Recently, for studying the large size networks which are based on graphs, has been used of complex networks concepts. Since the networks are the common structures of human systems, the purpose is to implement the suggested framework with the use of extracting complex networks properties of textual graph to model the summarization system. These approaches are unsupervised and use a very shallow syntactic information. A reason for suggesting these models, on the one hand, is the increased use of hand-held devices such as mobile phones that requires sentences to be more compact. On the other hand, the importance of saving the time has highlighted the need for strategies accelerate the access to information. The goal is to generate an ultra-concise and well-formed summary using the graph/network properties. Evaluation results show that the system generated summaries have high compatibility with human generated summaries
- Keywords:
- Summarization ; Complex Network ; Text Summarization ; Abstractive Summarization ; Graph Data Structure
-
محتواي کتاب
- view
- 11
- main
- چکیده
- فهرست جداول
- فهرست تصاویر
- معرفی پژوهش
- مقدمه
- هدف پژوهش
- تعریف پژوهش
- ساختار پژوهش
- ادبیات پژوهش
- مقدمه
- خلاصهسازی خودکار
- انواع سیستمهای خلاصهسازی
- شکل خروجی اسناد
- شکل ظاهری اسناد ورودی
- شیوه یادگیری ماشینی
- انواع سیستمهای خلاصهسازی
- مروری بر مفاهیم ساختار داده گراف
- مروری بر مفاهیم شبکههای پیچیده
- پیدایش
- شبکههای منظم
- شبکههای تصادفی
- شبکه جهان کوچک
- توان آزادی مقیاس
- شبکه زبانی
- جمعبندی و نتیجهگیری
- پیشینه پژوهش
- مقدمه
- روشهای مبتنی بر گراف
- روش مبتنی بر گراف معنایی
- روش مبتنی بر رتبهبندی صفحه
- روش مبتنی بر رتبهبندی متن
- روشی در جهت انسجام متون خلاصه چندسندی
- ارتباط پردازشهای زبانی با شبکههای پیچیده
- مقدمه
- شبکههای واژگانی
- پژوهشهای انجام شده در حوزه ساختار زبان با رویکرد شبکههای پیچیده
- پژوهشهای انجام شده در زمینه خلاصهسازی متنی
- پژوهشهای داخلی بر روی خلاصهسازی متن
- پژوهشهای خارجی بر روی خلاصهسازی متن
- جمعبندی و نتیجهگیری
- روش پیشنهادی ۱: مبتنی بر گراف
- مقدمه
- آمادهسازی داده
- جمعآوری داده متنی
- نرمال سازی متن
- برچسب زنی داده
- قطعهبندی جملات
- روش پيشنهادی
- مرحله اول: تولید گراف کلمات
- مرحله دوم: یافتن مسیرهای کاندید برای خلاصه
- امتیازدهی
- تولید خلاصه
- جمعبندی و نتیجهگیری
- روش پیشنهادی ۲: مبتنی بر شبکههای پیچیده
- مقدمه
- بررسی شبکه مورد پژوهش
- مقدمه
- ساخت شبکه متنی
- مشخصههای توصیف کننده توپولوژی شبکه متنی
- درجه و توزیع درجه
- کوتاهترین مسیر و کمر گراف
- ضریب خوشهبندی
- انتقالپذیری
- چگالی گراف
- معیار مرکزیت
- همسانی
- خوشهها، جوامع و افرازها
- خلاصهساز متنی با استفاده از مفاهیم شبکههای پیچیده
- جمعبندی و نتیجهگیری
- ارزیابی
- مقدمه
- معرفی روش ارزیابی
- روج
- معیار ارزیابی تعداد واژگان مشترک
- معیار ارزیابی تعداد n-تاییهای مشترک
- معیار ارزیابی طولانیترین زیررشته مشترک (LCS)
- معیار ارزیابی تعداد جفت کلمات مشترک با فاصله آزاد در متن
- روج
- نتایج ارزیابی مدلها
- مقایسه مدلهای پیشنهادی با روشهای پایه
- روشهای پایه
- تجزیه و تحلیل نتایج
- جمعبندی و نتیجهگیری
- نتیجهگیری و پیشنهادها
- جمعبندی
- نوآوریهای این پژوهش
- پیشنهاد برای پژوهشهای آتی
- مراجع
- پیوستها
- 22