Loading...
- Type of Document: M.Sc. Thesis
- Language: Farsi
- Document No: 57506 (19)
- University: Sharif University of Technology
- Department: Computer Engineering
- Advisor(s): Beigy, Hamid
- Abstract:
- Expert finding is an important task in community question answering (CQA) websites, enabling the routing of new questions towards users who have the highest level of expertise in the relevant topic. This method helps question raisers receive satisfactory responses in a shorter time and makes it easier for answerers to find questions they are interested in and have enough expertise to answer. . The primary goal in expert finding is to learn the representation of questions and expert candidates based on the history of answered questions. Many existing approaches generate a unique representation for users without considering the specific question asked. Additionally, many of these approaches only consider users' interest in answering questions and overlook their expertise. While deep learning-based approaches have significantly outperformed traditional methods, they face the challenge of high computational complexity, making the process of estimating expertise for all active community users time-consuming. To address these challenges, a model based on pre-trained language models is proposed, which: 1) learns the existing knowledge in CQA websites by introducing a pre-training paradigm, 2) enables the retrieval of questions similar to the new question from the expert candidate's history through a fine-tuning stage on duplicate questions, 3) provides an architecture for predicting expertise levels by learning the match between the new question and the user's question history based on question titles and tags, and 4) introduces a two-stage retrieval-re-ranking approach, where a model with lower computational complexity based on a multi-encoder is used for retrieving potential expert candidates, followed by re-ranking the retrieved candidates using a re-ranking model. The results of experiments conducted on four CQA datasets demonstrate that the proposed model has achieved average improvements of 1% and 1% in MRR and P@3 metrics, respectively, compared to the best baseline models
- Keywords:
- Expert Finding ; Community Question Answering ; Language Model ; Pretrained Models
-
محتواي کتاب
- view
- مقدمه
- تعریف مسئله
- چالشها
- رویکرد حل مسئله
- ساختار پایاننامه
- پیش زمینه
- بازنمایی متن
- شبکههای عصبی بازگشتی
- تبدیلگر
- شبکههای دوقلو
- یادگیری چند وظیفهای
- جمع بندی
- بازنمایی متن
- پیشینهی پژوهش
- بازیابی افراد خبره
- پژوهشهای پیشین برای بازیابی خبره
- رویکردهای سنتی
- رویکردهای مبتنی بر متن
- رویکردهای مبتنی بر شبکه
- رویکردهای مبتنی بر پالایش گروهی
- رویکردهای مبتنی بر دستهبندی
- رویکردهای ترکیبی
- رویکردهای مبتنی بر یادگیری ژرف
- معماریها خاص پیشنهاد خبره
- مدلهای زبانی از پیشآموزش دیده
- جمعبندی
- روش پیشنهادی
- مدل پیشنهادی
- پیشآموزش
- تنظیم دقیق برای بازیایی پرسشهای مشابه
- تنظیم دقیق برای پیشبینی میزان خبرگی
- بازیابی و رتبهبندی مجدد
- مراحل بازیابی و رتبهبندی مجدد
- جمع بندی
- مدل پیشنهادی
- بررسی نتایج تجربی
- مجموعه دادگان
- دادگان پیشآموزش
- دادگان مدل بازیابی پرسشهای مشابه
- معیارهای ارزیابی
- بررسی نتایج
- مقایسه نتایج با مدلهای پایه
- تاثیر در نظر گرفتن برچسب
- تأثیر پیشآموزش
- تعداد پرسشهای تاریخچه نامزد خبرگی
- تأثیر مدل بازیابی پرسشهای مشابه
- مقایسه همگرایی
- نتایج مدل بازیابی-رتبهبندی مجدد
- جمعبندی
- مجموعه دادگان
- نتیجهگیری
- کارهای آتی
- مراجع
- واژهنامه