Please enable javascript in your browser.
Page
of
0
استفاده از شبکه های عصبی عمیق در یادگیری تقویتی
صحاف نایینی، علیرضا Sahaf Naeini, Alireza
Cataloging brief
استفاده از شبکه های عصبی عمیق در یادگیری تقویتی
پدیدآور اصلی :
صحاف نایینی، علیرضا Sahaf Naeini, Alireza
ناشر :
صنعتی شریف
سال انتشار :
1396
موضوع ها :
یادگیری تقویتی Reinforcement Learning شبکه های عصبی عمیق Deep Neural Networks استخراج...
شماره راهنما :
19-50968
Find in content
sort by
page number
page score
Bookmark
فهرست شکلها
(6)
فهرست جدولها
(8)
مقدمه
(11)
تعریف مساله
(12)
اهمیت
(14)
کاربرد
(15)
چالشها
(16)
معیارهای ارزیابی
(18)
نوآوریهای این پژوهش
(18)
جمعبندی و ساختار پایاننامه
(19)
مفاهیم اولیه
(21)
یادگیری تقویتی
(21)
اجزاء مسئله یادگیری تقویتی
(22)
سیگنال امتیاز
(22)
عامل و محیط
(22)
حالات و تاریخچه
(24)
بهرهبرداری و جستوجو
(26)
روشهای پاسخ به مسائل یادگیری تقویتی
(26)
روش تکرارشونده ارزش
(27)
روش تکرارشونده سیاستی
(27)
تقریب توابع
(30)
شبکههای عصبی عمیق
(30)
انواع شبکههای عمیق
(32)
جمعبندی
(34)
روشهای پیشین
(35)
راهکارهای پیشین استفاده از شبکههای عصبی در یادگیری تقویتی
(35)
روشهای پیشین پیشبینی تصویر
(45)
استفاده از روشهای مبتنی بر پیشبینی تصویر در یادگیری تقویتی
(50)
جمعبندی
(51)
راهکار پیشنهادی
(53)
محیط و دادگان مورد استفاده
(54)
پیش آموزش شبکه DQN
(55)
عامل آیندهنگر
(57)
شبکه پیشبینی تصویر
(59)
شبکه تخمین امتیاز
(61)
شبکه بدون مدل
(65)
شبکه عامل آیندهنگر
(66)
جمعبندی
(67)
آزمایشها
(69)
مجموعهدادگان
(69)
شبیهساز
(69)
openAI Gym
(71)
بازی Freeway
(71)
بازی Breakout
(72)
دادگان تهیه شده از بازیها
(72)
معیار ارزیابی
(73)
معیار ارزیابی مورد استفاده در عاملها
(73)
معیار ارزیابی مورد استفاده در شبکه پیشبینی امتیاز
(74)
نتایج اعمال روش پیشنهادی
(74)
روش پیش آموزش شبکه DQN
(75)
نتایج آموزش شبکه پیشبینی تصویر
(77)
نتایج آموزش شبکه پیشبینی امتیاز
(79)
شبکه دستهبند
(80)
شبکه برچسب گذار امتیاز
(80)
تحلیل نتایج
(84)
جمعبندی
(85)
جمعبندی و کارهای آتی
(86)
جمعبندی
(86)
کارهای آتی
(86)
بهبود عملکرد جستوجوی عامل
(86)
تولید داده و کمتر نمودن نیاز به تعامل با محیط
(87)
استفاده از ویژگیهای دیگر بازی
(87)
پیشبینی بازنمایی تصویر
(87)
عمومیت عامل
(88)
استفاده از روشهای برنامهریزی
(88)
مراجع
(88)