Loading...
- Type of Document: M.Sc. Thesis
- Language: Farsi
- Document No: 49050 (19)
- University: Sharif University of Technology
- Department: Computer Engineering
- Advisor(s): Beigy, Hamid
- Abstract:
- With the increasing use of the Internet, we are witnessing the exchange of gigabytes of text in cyberspace. Cyberspace makes it possible for individuals to hide their true identity and enter this space with an spurious one. Abuses that occur in online communities due to the use of unknown identities, reduce confidence in this type of communication and create many challenges in this area. Hence the importance of maintaining the security of the space, controling the user-generated content and identifying the authors of texts increases day by day. In this Research we have presented an approach to author identification. This approach is based on modeling the style of the authors on the basis of the texts available to them. In this way, by providing a ranking algorithm for every text with an unkown author, the authors are ranked on the basis of the probability that the text belongs to them. performance is also improved by applying pre-processings to the text and reducing the feature space by the selection of features with higher separation power. The proposed approach has been evaluated in terms of performance measures in data recovery by designing and conducting experiments on a set of standard texts in Persian and English languages . The results of these experiments have shown that the proposed method has greater efficiency in comparison with the previous methods of author identification
- Keywords:
- Feature Selection ; Author Identification ; Ranking ; Ranking Author ; Style Writing
-
محتواي کتاب
- view
- مقدمه
- مسأله تشخیص نویسنده و ابعاد آن
- راهکارهای ارائه شده در پایاننامه
- ساختار پایاننامه
- پژوهشهای انجامشده در تشخیص نویسنده
- مسأله تشخیص نویسنده
- چارچوبی برای ردهبندی و مقایسه مسئلهها و راهکارها
- ویژگیهای سبک نگارشی برای مدل کردن سبک نویسنده
- روش پیش بینی نویسندگان متون
- روش کاهش فضای ویژگی
- روشهای پیشین
- مقایسه کارهای پیشین
- جمعبندی
- روش پیشنهادی در تشخیص نویسنده
- روش پیشنهادی
- ویژگیهای مورد استفاده برای استخراج سبک نویسنده
- انتخاب ویژگی
- رتبه بندی نویسندگان
- جمعبندی
- نتایج آزمایشات تجربی
- ارزیابی روش پیشنهادی
- آزمایشها
- مجموعههای آزمون
- پیکربندی آزمایشها و معیارهای کارایی
- نتایج آزمایشها
- مقایسه رویکرد پیشنهادی با روشهای پیشین
- تاثیر روش پیشبینی تشخیص نویسنده
- تاثیر تعداد نویسندگان
- تاثیر تعداد و طول متون در مرحله آموزش
- قدرت جداسازی ویژگیها
- تاثیر نوع انتخاب ویژگی
- تاثیر پیشپردازشها
- تاثیر معیار شباهت در الگوریتم رتبهبندی
- جمعبندی
- نتیجه گیری و کارهای آِینده
- نتیجهگیری
- کارهای آتی
- مراجع
- مجموعه متون وبلاگهای خاطرات فارسی
- واژه نامه انگلیسی به فارسی
- واژه نامه فارسی به انگلیسی