Sharif Digital Repository / Sharif University of Technology
    • [Zoom In]
    • [Zoom Out]
  • Page 
     of  0
  • [Previous Page]
  • [Next Page]
  • [Fullscreen view]
  • [Close]
 
بهبود ترجمه گفتار - به - گفتار در سامانه‌ های دوبله صوتی
رشیدی، سینا Rashidi, Sina

Cataloging brief

بهبود ترجمه گفتار - به - گفتار در سامانه‌ های دوبله صوتی
پدیدآور اصلی :   رشیدی، سینا Rashidi, Sina
ناشر :   صنعتی شریف
سال انتشار  :   1403
موضوع ها :   دوبله صوتی Audio Dubbing ترجمه گفتار - به - گفتار مستقیم Direct Speech-to-Speech...
شماره راهنما :   ‭19-57440

Find in content

sort by

Bookmark

  • مقدمه (15)
    • تعریف مسئله (15)
    • اهمیت موضوع (15)
    • ادبیات موضوع (16)
    • اهداف پژوهش (18)
    • ساختار پایان‌نامه (19)
  • مفاهیم اولیه (20)
    • مقدمه (20)
    • شبکه‌های عصبی (20)
    • شبکه‌های عصبی مصنوعی (21)
    • شبکه‌های عصبی پیچشی (22)
      • ساختار شبکه‌های عصبی پیچشی (22)
    • شبکه‌های عصبی بازخوردار (23)
      • ساختار شبکه‌های عصبی بازخوردار (23)
      • شبکه‌های حافظه کوتاه مدتِ بلند (25)
    • مبدل‌ها (28)
      • کدکننده (29)
      • کدگشا (30)
      • سازوکار توجه (30)
      • رمزگذاری موقعیتی (32)
    • کانفورمر (32)
      • ساختار کانفورمر (33)
    • شبکه‌های مولد تخاصمی (36)
      • ساختار شبکه‌های مولد تخاصمی (36)
    • مدل‌های زبانی بزرگ (38)
    • معیارهای ارزیابی (38)
      • معیار میزان خطای حروف (39)
      • معیار میزان خطای کلمه (39)
      • معیار BLEU (40)
      • معیار BLEU ASR (41)
      • معیار METEOR (41)
      • معیار MOS (42)
    • جمع‌بندی (43)
  • کارهای پیشین (44)
    • مقدمه (44)
    • مدل‌های مبتنی بر طیف‌نگار گفتار (45)
      • مدل ترنسلیتوترون (45)
      • مدل ترنسلیتوترون 2 (47)
    • مدل‌‌های مبتنی بر واحدهای گسسته گفتار (48)
      • ترجمه گفتار-به-واحد (50)
      • کدکننده صدای مبتنی بر واحد گسسته (52)
    • پیش‌آموزش خودنظارت در مدل‌های ترجمه گفتار-به-گفتار (53)
      • مدل UnitY (54)
    • مدل ترنسلیتوترونِ بدون متن (55)
      • ساختار مدل ترنسلیتوترون بدون متن (56)
      • عملکرد مدل ترنسلیتوترون بدون متن (56)
    • جمع‌بندی (57)
  • راهکار پیشنهادی (58)
    • مقدمه (58)
    • داده‌های استفاده شده (58)
      • داده‌های Voice Common (58)
      • داده‌های CVSS (59)
      • داده‌های LJSpeech (60)
    • ساختار مدل پیشنهادی (61)
      • کدکننده (61)
      • کدگشا (64)
      • وفق‌دهنده طول (66)
      • پیش‌پردازش داده‌های گفتار مقصد (67)
      • کدکننده صدا (68)
    • روش‌های افزونگی داده (70)
      • اعوجاج زمانی (70)
      • پوشش فرکانسی (71)
      • پوشش زمانی (71)
    • تولید داده‌های جدید (73)
      • داده‌های فارسی بیشتر (73)
      • ترجمه ماشینی متن داده‌ها به زبان انگلیسی (74)
      • تبدیل متون ترجمه‌شده به گفتارهای مقصد (74)
      • پیکره گفتاری ساخته‌شده (75)
    • جمع‌بندی (76)
  • آزمایش‌ها و نتایج جدید (77)
    • مقدمه (77)
    • روش پیاده‌سازی (77)
    • تولید پیکره داده‌های جدید (78)
    • فرایند آموزش مدل (78)
      • فرایندهای پیش‌نیاز آموزش مدل اصلی (78)
      • آموزش مدل اصلی (79)
    • نتایج آموزش مدل (80)
      • نتایج آموزش مدل با داده‌های CVSS (81)
      • نتایج آموزش مدل با پیکره ساخته‌شده (82)
      • نتایج عملکرد مدل با معیار METEOR (83)
    • نمونه خروجی‌های مدل (84)
    • جمع‌بندی (85)
  • نتیجه‌گیری (86)
    • نوآوری‌ها و دستاوردهای این پژوهش (86)
    • مسائل باقی‌مانده (87)
    • پیشنهادهایی برای ادامه کار (87)
  • مراجع (88)
  • واژه‌نامه (94)
Loading...