Loading...
Automatic Recognition of Quranic Maqams Using Machine Learning
Khodabandeh, Mohammad Javad | 2021
634
Viewed
- Type of Document: M.Sc. Thesis
- Language: Farsi
- Document No: 54400 (31)
- University: Sharif University of Technology
- Department: Languages and Linguistics Center
- Advisor(s): Sameti, Hossein; Bahrani, Mohammad
- Abstract:
- Automatic recognition of musical Maqams has been one of the challenging problems in Music Information Retrieval. Despite the increasing amount of related research in recent years, we are still far away from building related real-life applications. Nevertheless, a very small portion of these research is dedicated to automatic recognition of Maqams in recitation of the Holy Quran. In this thesis, as a first attempt, we have used machine learning methods to classify six Maqam families which are commonly used in Quran recitation. Also, due to the lack of pre-exisiting datasets, we have annotated approximately 1325 minutes of Tadwir recitation from two prominent Egyptian reciters, i.e., Muhammad Siddiq Al-Minshawi, and Shahat Muhammad Anwar. Three different classifiers have been used: Support Vector Machines, Feed-forward Neural Network, and Long Short-term Memory Recurrent Neural Network. To represent audio samples, two commonly recognized features were extracted and compared: Mel-frequency Cepstral Coefficients, and Harmonic Pitch Class Profiles. The results demonstrate significant superiority of Harmonic Pitch Class Profiles and Long Short-term Memory Recurrent Neural Network in representation of Maqams and their classification, respectively, over the other methods. As such, F-scores of the three mentioned classifiers are 72.71, 75.11, and 81.48 percent, respectively, for Minshawi's recitation, and 51.73, 61.22, and 69.75 percent, respectively, for Shahat's recitation. Results of two-, three-, four-, and five-class cases are also reported in Support Vector Machine classifier, in addition to the six-class case.
- Keywords:
- Music Information Retrieval ; Machine Learning ; Automatic Quranic Maqams Recognition ; Feedforward Neural Network
-
محتواي کتاب
- view
- فهرست جدولها
- فهرست تصویرها
- فهرست نمودارها
- فصل1 مقدمه
- 1-1 بیان مسئلۀ پژوهش
- 1-2 اهداف پژوهش
- 1-3 سؤالات پژوهش
- 1-4 فرضیههای پژوهش
- 1-5 چالشهای پیشرو
- 1-6 محتوای فصلها
- فصل2 ادبیات پژوهش
- 2-1 مقدمه
- 2-2 بحثهای نظری
- 2-2-1 موسیقی تلاوت
- 2-2-1-1 مفاهیم نظری پایه
- 2-2-1-2 جنس
- 2-2-1-3 مقام
- 2-2-1-4 تحریر و قفله در تلاوت قرآن
- 2-2-2 یادگیری ماشین و یادگیری ژرف
- 2-2-2-1 ماشین بردار پشتیبان
- 2-2-2-2 شبکۀ عصبی پیشخور
- 2-2-2-3 شبکه عصبی بازگشتی حافظه کوتاهمدت بلند
- 2-2-1 موسیقی تلاوت
- 2-3 پیشینۀ پژوهش
- 2-3-1 تشخیص خودکار مقامهای قرآنی
- 2-3-2 تشخیص خودکار مقامها در موسیقی
- 2-3-2-1 مقامهای ترکی
- 2-3-2-2 دستگاهها و گوشههای ایرانی
- 2-4 خلاصۀ فصل
- فصل3 دادگان و روشهای پیشنهادی
- 3-1 مقدمه
- 3-2 معرفی ابزار مورد استفاده
- 3-3 آمادهسازی دادگان
- 3-3-1 انتخاب صوت قاری
- 3-3-2 نحوۀ جمعآوری داده
- 3-4 روششناسی
- 3-4-1 پیشپردازش و استخراج ویژگی
- 3-4-2 تنظیم ابرپارامترهای استخراج ویژگی و اسویام
- 3-4-3 تنظیم ابرپارامترهای شبکۀ پیشخور
- 3-4-4 تنظیم ابرپارامترهای شبکۀ بازگشتی الاستیام
- 3-5 خلاصۀ فصل
- فصل4 نتایج روشهای پیشنهادی
- 4-1 مقدمه
- 4-2 معیارهای ارزیابی
- 4-3 نتایج روش مبتنیبر اسویام
- 4-3-1 تلاوت منشاوی
- 4-3-2 تلاوت شحات
- 4-3-3 مجموع دادگان
- 4-3-4 تأثیر افزایش دادگان
- 4-4 نتایج روش مبتنیبر شبکۀ پیشخور
- 4-4-1 تلاوت منشاوی
- 4-4-2 تلاوت شحات
- 4-4-3 مجموع دادگان
- 4-4-4 طول مناسب قطعات برای تشخیص مقام
- 4-5 نتایج روش مبتنیبر شبکۀ بازگشتی الاستیام
- 4-5-1 تلاوت منشاوی
- 4-5-2 تلاوت شحات
- 4-5-3 مجموع دادگان
- 4-6 خلاصۀ فصل
- فصل5 جمعبندی و پیشنهادها
- 5-1 خلاصۀ پایاننامه
- 5-2 پیشنهادها
- پیوست1 اجناس متداول در موسیقی مقامی عرب
- پیوست2 نتایج جستجوی شبکهای بهترین پارامترها برای «پروفایلهای دستۀ زیروبمی هارمونیک»
- پیوست3 نتایج جستجوی شبکهای بهترین پارامترها برای «ضرایب کپسترال فرکانس مبتنیبر معیار مل»