Loading...
Improving Robustness of Question Answering Systems Using Deep Neural Networks
Boreshban, Yasaman | 2023
4
Viewed
- Type of Document: Ph.D. Dissertation
- Language: Farsi
- Document No: 56801 (19)
- University: Sharif University of Technology
- Department: Computer Engineering
- Advisor(s): Ghassem Sani, Gholamreza; Mirroshandel, Abolghasem
- Abstract:
- Question Answering (QA) systems have reached human-level accuracy; however, these systems are vulnerable to adversarial examples. Recently, adversarial attacks have been widely investigated in text classification. However, there have been few research efforts on this topic in QA systems. In this thesis our approach is improving the robustness of QA systems using deep neural networks. In this thesis, as the first proposed approach, the knowledge distillation method is introduced to create a student model to improve the robustness of QA systems. In this regard, the pre-trained BERT model was used as a teacher, and its impact on the robustness of the student models on the Adversarial SQuAD dataset was assessed. Our experiments show that by using KD, both criteria F1-score and EM of the student models by around 5.0\% increased when tested on the AddSent and AddOneSent adversarial datasets. Before this, knowledge distillation was not used to improve the robustness of QA systems. In order to more accurately evaluate the effect of various attacks on the robustness of QA systems, in the second approach, we modified the attack algorithms widely used in text classification to fit those algorithms for QA systems. We developed a new framework, RobustQA, as the first open-source toolkit for investigating textual adversarial attacks in QA systems. In this framework, in addition to the six existing algorithms, it is possible to develop new attack algorithms in QA systems easily. Since adversarial training is one of the common methods of improving the robustness of deep learning models, it is possible to use this approach with different attack algorithms in this framework. In the third proposed approach, we have presented a new attack algorithm using the evolutionary algorithm of harmony search, which has yielded promising results compared to two evolutionary algorithms, Genetic and PSO. We also investigated the robustness of the models against various attacks by using adversarial training through adversary sentences generated by the harmony search algorithm. In our fourth proposed approach, we used quantization to improve the robustness of NLP models, especially on QA and classification Tasks. Quantization involves mapping a high-precision real number to a lower-precision value, aiming at reducing the size of the model. In our experiments, we evaluated the impact of quantization on the BERT model in the QA system using the SQuAD dataset against TextFooler and PSO adversarial attacks. The results showed that by applying quantization, the robustness of the model against the Textfooler and PSO attacks increases both the F1-score and EM by around 20.0 \%. Furthermore, we evaluated the impact of quantization in the text classification using SST-2, Emotion, and MR datasets against TextFooler, PWWS, and PSO adversarial attacks. Our findings showed that quantization significantly improves by an average of 18.68\% the adversarial accuracy of the models
- Keywords:
- Question Answering ; Robustness ; Adversarial Example ; Knowledge Distillation ; Adversarial Training ; Quantification ; Deep Neural Networks
- محتواي کتاب
- view
- مقدمه
- تعریف، اهمیت و کاربرد مسئله
- روشهای پیشنهادی
- ساختار رساله
- مفاهیم و تعاریف مرتبط
- مقدمه
- تاریخچه سامانهها و مجموعه دادگان پرسش و پاسخ
- انواع سامانههای پرسش و پاسخ
- سامانه با دامنه باز یا نامحدود
- سامانه با دامنه بسته یا محدود
- انواع سوالات
- معماری سامانههای پرسش و پاسخ
- بازنمایی
- حمله و استحکام
- تقطیر دانش
- کمیسازی
- خلاصه
- پژوهشهای پیشین
- مقدمه
- روشهای غیرشبکه عصبی سامانههای پرسش و پاسخ
- روشهای شبکه عصبی سامانههای پرسش و پاسخ
- حمله و استحکام در شبکههای عصبی ژرف
- تقطیر دانش در پردازش زبان طبیعی
- کمیسازی
- خلاصه
- روش پیشنهادی
- مقدمه
- روش پیشنهادی اول:به کارگیری روش تقطیر دانش
- تطبیق نشانه گذاری مدل معلم و دانش آموز در سامانههای پرسش و پاسخ
- روش پیشنهادی دوم: ارائه چارچوب RobustQA به منظور تحلیل جملات خصمانه در سامانههای پرسش و پاسخ
- پرسش و پاسخ در مقابل رده بندی متن
- ساختار داده ورودی
- تابع هدف
- الگوریتم حمله
- چارچوب RobustQA
- نشانهگذار
- مدل قربانی
- اهداف
- ارزیاب
- معیارها
- مهاجم
- انتخابگر حمله
- روش پیشنهادی سوم: ارائه یک حمله جدید با استفاده از الگوریتم تکاملی جستجوی هارمونی
- جستجوی هارمونی
- ارائه یک الگوریتم حمله جدید با استفاده از جستجوی هارمونی
- روش پیشنهادی چهارم: استفاده از کمیسازی برای بهبود استحکام سامانههای پرسش و پاسخ
- کمیسازی در پردازش زبان طبیعی
- خلاصه
- آزمایش و ارزیابی
- مقدمه
- اعمال تقطیر دانش در سامانههای پرسش و پاسخ
- مجموعه داده
- معیار ارزیابی
- مدلها
- تنظیمات آزمایش
- ارائه چارچوب RobustQA
- تنظیمات آزمایش
- آزمایشها
- استفاده از چارچوب
- مثالهای خصمانه
- تولید جملات خصمانه با استفاده از الگوریتم جستجوی هارمونی
- دادگان و مدلهای قربانی
- نتایج
- تاثیر کمیسازی بر استحکام سامانههای پرسش و پاسخ
- تنظیمات آزمایش
- الگوریتمهای حمله
- دادگان
- حجم مدلها قبل و پس از کمیسازی
- تاثیر کمیسازی در بهبود استحکام سامانههای رده بندی متن
- مقایسهی عملکرد کمیسازی با آموزش خصمانه
- اعمال کمیسازی در سامانههای پرسش و پاسخ
- نمونه مثالهای خصمانه
- خلاصه
- نتیجهگیری
- مقدمه
- جمعبندی و نتیجهگیری
- کارهای آتی
- مطالب تکمیلی
- تنظیمات آزمایشها
- مراجع
- واژهنامهی فارسی به انگلیسی
- واژهنامهی انگلیسی به فارسی
- مقدمه
- مفاهیم و تعاریف مرتبط
- پژوهشهای پیشین
- روش پیشنهادی
- مقدمه
- روش پیشنهادی اول:به کارگیری روش تقطیر دانش
- روش پیشنهادی دوم: ارائه چارچوب RobustQA به منظور تحلیل جملات خصمانه در سامانههای پرسش و پاسخ
- روش پیشنهادی سوم: ارائه یک حمله جدید با استفاده از الگوریتم تکاملی جستجوی هارمونی
- روش پیشنهادی چهارم: استفاده از کمیسازی برای بهبود استحکام سامانههای پرسش و پاسخ
- خلاصه
- آزمایش و ارزیابی
- نتیجهگیری
- مطالب تکمیلی
- مراجع
- واژهنامهی فارسی به انگلیسی
- واژهنامهی انگلیسی به فارسی