Please enable javascript in your browser.
Page
of
0
تفکیک متن منابع صوتی تککاناله با استفاده از شبکه های عصبی عمیق
رمضانی بناب، امیر حسین Ramazani Bonab, Amirhossein
Cataloging brief
تفکیک متن منابع صوتی تککاناله با استفاده از شبکه های عصبی عمیق
پدیدآور اصلی :
رمضانی بناب، امیر حسین Ramazani Bonab, Amirhossein
ناشر :
دانشگاه صنعتی شریف
سال انتشار :
1401
موضوع ها :
پردازش صوت Audio Processing یادگیری عمیق Deep Learning رمزگذار - رمزگشا Encoder-Decoder ...
شماره راهنما :
19-56287
Find in content
sort by
page number
page score
Bookmark
مقدمه
(13)
بیان صورت مسئله
(14)
کاربردها
(14)
چالشها
(16)
داده
(16)
تعداد منابع صوتی
(16)
نرخ خطای فرایند
(16)
هزینهی پردازشی
(17)
نوآوریها
(17)
ساختار فصلها
(18)
مفاهیم پایه
(19)
مقدمه
(19)
مکانیزم توجه
(19)
مکانیزم توجه چند واحدی
(22)
مکانیزم خودتوجهی
(23)
معماری ترنسفرمر
(23)
جمعبندی
(25)
پژوهشهای پیشین
(26)
مقدمه
(26)
روشهای تککاناله
(27)
روشهای مبتنی بر حوزهی فرکانس
(27)
روشهای مبتنی بر حوزهی زمان
(33)
روشهای چندکاناله
(41)
جمعبندی
(42)
روش پیشنهادی
(44)
مقدمه
(44)
بیان رسمی مسئله
(45)
معماری پیشزمینه
(46)
مدل wav2vec2.0
(46)
مدل ترنسفرمر دومسیره
(48)
فرایندهای پیشنهادی تفکیک منابع صوتی
(49)
فرایند پایهای
(50)
فرایند بهبودیافته
(50)
فرایند مبتنی بر فضای بازنمایی
(52)
فرایند مبتنی بر فضای بازنمایی بهبودیافته
(53)
جمعبندی
(54)
آزمایشها
(55)
مقدمه
(55)
دادهی آزمون
(56)
معیار ارزیابی
(57)
فاصلهی ویرایشی
(57)
نرخ خطای نویسه
(58)
نرخ خطای کلمه
(58)
نتایج آزمایشهای انجام شده
(59)
نتایج فرایند پایهای
(61)
نتایج فرایند بهبودیافته
(62)
نتایج فرایند مبتنی بر فضای بازنمایی
(63)
فرایند مبتنی بر فضای بازنمایی بهبودیافته
(64)
مقایسهی نتایج به دست آمده
(65)
مقایسهی نرخ خطای کلمه
(65)
مقایسهی زمان مورد نیاز هر فرایند
(65)
مقایسهی حفظ حریم شخصی
(66)
جمعبندی
(67)
جمعبندی و کارهای آتی
(69)
جمعبندی
(69)
کارهای آتی
(70)
طراحی فرایند سیگنالهای صوتی نویزی
(70)
طراحی فرایندهای چند زبانه
(70)
سادهسازی ساختار کدگشا و کدگذار در مدل تفکیک منابع صوتی
(71)
مراجع
(72)
واژهنامه
(77)
فهرست اختصارات
(80)
مطالب تکمیلی
(81)