Sharif Digital Repository / Sharif University of Technology
    • [Zoom In]
    • [Zoom Out]
  • Page 
     of  0
  • [Previous Page]
  • [Next Page]
  • [Fullscreen view]
  • [Close]
 
تفکیک متن منابع صوتی تک‌کاناله با استفاده از شبکه های عصبی عمیق
رمضانی بناب، امیر حسین Ramazani Bonab, Amirhossein

Cataloging brief

تفکیک متن منابع صوتی تک‌کاناله با استفاده از شبکه های عصبی عمیق
پدیدآور اصلی :   رمضانی بناب، امیر حسین Ramazani Bonab, Amirhossein
ناشر :   دانشگاه صنعتی شریف
سال انتشار  :   1401
موضوع ها :   پردازش صوت Audio Processing یادگیری عمیق Deep Learning رمزگذار - رمزگشا Encoder-Decoder ...
شماره راهنما :   ‭19-56287

Find in content

sort by

Bookmark

  • مقدمه (13)
    • بیان صورت مسئله (14)
    • کاربردها (14)
    • چالش‌ها (16)
      • داده (16)
      • تعداد منابع صوتی (16)
      • نرخ خطای فرایند (16)
      • هزینه‌ی پردازشی (17)
    • نوآوری‌ها (17)
    • ساختار فصل‌ها (18)
  • مفاهیم پایه (19)
    • مقدمه (19)
    • مکانیزم توجه (19)
      • مکانیزم توجه چند واحدی (22)
      • مکانیزم خودتوجهی (23)
    • معماری ترنسفرمر (23)
    • جمع‌بندی (25)
  • پژوهش‌های پیشین (26)
    • مقدمه (26)
    • روش‌های تک‌کاناله (27)
      • روش‌های مبتنی بر حوزه‌ی فرکانس (27)
      • روش‌های مبتنی بر حوزه‌ی زمان (33)
    • روش‌های چندکاناله (41)
    • جمع‌بندی (42)
  • روش پیشنهادی (44)
    • مقدمه (44)
    • بیان رسمی مسئله (45)
    • معماری پیش‌زمینه (46)
      • مدل wav2vec2.0 (46)
      • مدل ترنسفرمر دومسیره (48)
    • ‌فرایندهای پیشنهادی تفکیک منابع صوتی (49)
      • ‌فرایند پایه‌ای (50)
      • فرایند بهبودیافته (50)
      • فرایند مبتنی بر فضای بازنمایی (52)
      • فرایند مبتنی بر فضای بازنمایی بهبودیافته (53)
    • جمع‌بندی (54)
  • آزمایش‌ها (55)
    • مقدمه (55)
    • داده‌ی آزمون (56)
    • معیار ارزیابی (57)
      • فاصله‌ی ویرایشی (57)
      • نرخ خطای نویسه (58)
      • نرخ خطای کلمه (58)
    • نتایج آزمایش‌های انجام شده (59)
      • نتایج فرایند پایه‌ای (61)
      • نتایج فرایند بهبودیافته (62)
      • نتایج فرایند مبتنی بر فضای بازنمایی (63)
      • فرایند مبتنی بر فضای بازنمایی بهبودیافته (64)
    • مقایسه‌ی نتایج به دست آمده (65)
      • مقایسه‌ی نرخ خطای کلمه (65)
      • مقایسه‌ی زمان مورد نیاز هر فرایند (65)
      • مقایسه‌ی حفظ حریم شخصی (66)
    • جمع‌بندی (67)
  • جمع‌بندی و کارهای آتی (69)
    • جمع‌بندی (69)
    • کارهای آتی (70)
      • طراحی فرایند سیگنال‌های صوتی نویزی (70)
      • طراحی فرایند‌های چند زبانه (70)
      • ساده‌سازی ساختار کدگشا و کدگذار در مدل تفکیک منابع صوتی (71)
  • مراجع (72)
  • واژه‌نامه (77)
  • فهرست اختصارات (80)
  • مطالب تکمیلی (81)
Loading...