Loading...
- Type of Document: M.Sc. Thesis
- Language: Farsi
- Document No: 55260 (19)
- University: Sharif University of Technology
- Department: Computer Engineering
- Advisor(s): Heydarnoori, Abbas
- Abstract:
- Testing is one of the most important and time-consuming steps in the Software Development Life Cycle. Especially, in recent methodologies like agile in which change is an important feature and they take place in iterations with each iteration taking place in a limited time. Recent studies suggest approaches to automatically generate test cases for the applications. For GUI-based applications, test cases are composed of a chain of events that are activated by the user. For these applications, we can generate test cases by simulating the chain of events that get activated by the user. Semantic-based approaches use the semantic matching of the events and their related widgets, to generate test cases given the usage patterns of the applications or the test cases of similar applications. In this study, we intend to use domain-specific datasets to increase the semantic matching effectiveness in test reuse. Our domain-specific datasets are one composed of 900,805 application descriptions crawled from the Google Play Store, and the other, the same data set divided into 27 functionally similar applications. We then used these two datasets to train word embedding models, embedded those models in 48 different semantic matching configurations, and evaluated the final results given 337 unique queries extracted from previous similar studies. The calculated values of TOP1 and MRR metrics when using the general data set are respectively 0.5273 and 0.7101 on average. The calculated values for these metrics when using this data set after being divided into 27 domain-specific subsets are on average 0.5035 and 0.6907 respectively. Our results indicate that while the usage of domain-specific word embedding models improves semantic matching in the reuse of test cases of GUI applications, there is a turning point that specifies the ideal level of specialization.
- Keywords:
- Automated Test Data Generation ; Natural Language Processing ; Topic Modeling ; Word Embedding ; Semantic Matching ; Test Reuse
-
محتواي کتاب
- view
- مقدمه
- تعریف مسئله
- اهمیت موضوع
- ایده حل مسئله
- نوآوریهای راهکار پیشنهادی
- مشارکت
- ساختار پایاننامه
- مفاهیم اولیه
- مقدمه
- مفاهیم مربوط به محیط مسئله
- تولید خودکار موارد آزمون در برنامههای دارای واسط کاربری گرافیکی
- پردازش زبانهای طبیعی
- پیشپردازش متن
- استخراج ویژگیها
- تعبیهی لغت
- مدلسازی موضوعات
- کارهای پیشین
- مقدمه
- رویکردهای تولید خودکار موارد آزمون
- روشهای تصادفی
- روشهای بیشینهکردن پوشش کد
- روشهای مبتنی بر مدل
- روشهای مبتنی بر معنا
- تطابق معنایی در استفادهی مجدد از موارد آزمون
- استخراج کنندهی توصیفات رویدادها
- الگوریتم تطابق معنایی
- دستهبندی برنامهها در فروشگاههای نرمافزاری موبایل
- جمعبندی کارهای پیشین
- راهکار پیشنهادی
- مقدمه
- نگاهی اجمالی بر رویکرد پیشنهادی
- مجموعهی داده
- دستهبندی برنامهها
- پیشپردازش
- پیشپردازشهای خاص دامنه
- استخراج ویژگیها
- مدلسازی موضوعات
- طراحی آزمایشهای انتخاب بهترین دستهبند
- پیشپردازش
- آموزش مدلهای تعبیهی لغت
- مبنای ارزیابی
- تطابق معنایی
- استفادهی سلسلهمراتبی از مدلها
- ارزیابی راهکار پیشنهادی و نتایج جدید
- مقدمه
- انتخاب بهترین دستهبند
- انتخاب بهترین تعداد موضوعات در الگوریتمهای LDA و LSA
- نتایج آزمایشهای انجام شده بر روی مجموعهی دادهی نمونه
- دستهبندی برنامههای GOOGLE-PLAY
- آموزش مدلهای تعبیهی لغت
- تنظیم آزمایشهای نهایی
- برنامههای مورد بررسی
- سناریوهای مهاجرت موارد آزمون مورد بررسی
- استخراج پرسمانهای تطابق معنایی
- مجموعهی رویدادهای کاندید مقصد
- پیکربندیهای تطابق معنایی
- آزمایشهای نهایی
- معیارهای ارزیابی
- MRR
- TOP1
- معنیداری آماری
- نتایج نهایی
- تحلیل نتایج
- تحلیل مکمل بودن
- تحلیل نتایج
- تهدیدات علیه اعتبار
- اعتبار درونی
- اعتبار بیرونی
- اعتبار ساخت
- قابلیت اطمینان
- نتیجهگیری و کارهای آتی
- مقدمه
- نقاط ضعف و قوت
- نقاط قوت
- نقاط ضعف
- کارهای آتی
