Please enable javascript in your browser.
Page
of
0
طراحی و پیاده سازی ماژول عدم برخورد با مانع درمحیط دینامیک با استفاده از یادگیری تقویتی عمیق بر روی ربات اجتماعی آرش
نوروزی، مصطفی Norouzi, Mostafa
Cataloging brief
طراحی و پیاده سازی ماژول عدم برخورد با مانع درمحیط دینامیک با استفاده از یادگیری تقویتی عمیق بر روی ربات اجتماعی آرش
پدیدآور اصلی :
نوروزی، مصطفی Norouzi, Mostafa
ناشر :
صنعتی شریف
سال انتشار :
1400
موضوع ها :
یادگیری تقویتی عمیق Deep Reinforcement Learning یادگیری تقویتی Reinforcement Learning ...
شماره راهنما :
08-54941
Find in content
sort by
page number
page score
Bookmark
فهرست مطالب
(7)
فهرست تصاویر
(11)
فهرست جداول
(14)
مقدمه
(17)
اهمیت و ضرورت پژوهش
(17)
اهداف پژوهش
(18)
ساختار پژوهش
(18)
مفاهیم پایه
(20)
یادگیری تقویتی
(20)
اجزای یادگیری تقویتی
(21)
فرایند تصمیم گیری مارکوف
(22)
پاداش انباره ای
(23)
سیاست و تابع ارزش
(23)
تابع ارزش-عمل Q
(24)
روش مونت کارلو
(24)
روش تفاضل زمانی
(24)
یادگیری سارسا
(25)
یادگیری Q
(25)
یادگیری تقویتی عمیق
(26)
روش های برپایه تابع ارزش
(26)
روشهای برپایه سیاست
(29)
یادگیری بازنمایی متقابل
(33)
تابع هزینه InfoNCE
(33)
جمعبندی
(34)
مرور ادبیات
(35)
مقدمه
(35)
انواع روشهای مسیریابی ربات در محیط شلوغ
(35)
مسیریابی متمرکز
(37)
مسیریابی غیرمتمرکز
(38)
مسیریابی غیرمشارکتی
(38)
مسیریابی مشارکتی مبتنی بر مسیر
(39)
مسیریابی مشارکتی مبتنی بر واکنش
(40)
مسیریابی مشارکتی مبتنی بر یادگیری تقویتی
(40)
مسیریابی مبتنی بر سنسور
(41)
مسیریابی مبتنی بر عامل
(43)
انواع روش شناسایی عابرپیاده
(45)
شناسایی با استفاده از سنسور لایدار
(45)
شناسایی با استفاده از دوربین معمولی
(46)
شناسایی با استفاده از دوربین عمق
(47)
شناسایی با استفاده از ترکیب سنسورها
(47)
جمع بندی
(49)
روش پژوهش
(51)
مقدمه
(51)
معماری سختافزاری و نرمافزاری ربات آرش۲
(52)
معماری سختافزاری
(53)
معماری نرمافزاری
(54)
شبیهسازی ربات در محیط گزبو
(56)
پیاده سازی الگوریتم اسلم
(57)
پیادهسازی ماژول شناسایی و تعقیب افراد
(59)
گره خوشهبندی دادههای لایدار
(60)
ترکیب سنسور آی ام یو و ادومتری
(60)
کالیبراسیون سنسور آی ام یو
(61)
ترکیب سنسور با استفاده از کالمن فیلتر توسعه یافته
(61)
طراحی و پیادهسازی شبکه یادگیری تقویتی عمیق
(62)
شبکه عصبی نوع اول
(62)
شبکه عصبی نوع دوم
(69)
یادگیری بازنمایی متقابل
(74)
مسیریابی محلی با مقصد دینامیک
(81)
مسیریابی محلی در محیط استاتیک
(82)
پیاده سازی نود ارتباطی شبکه عصبی با ربات
(83)
نتایج و یافتهها
(85)
نتایج شبیهسازی ربات آرش۲
(85)
نتایج اجرای الگوریتم اسلم بر روی ربات آرش۲
(87)
نتایج پیادهسازی ماژول شناسایی و تعقیب افراد
(88)
نتایج آموزش شبکه عصبی نوع اول
(88)
جزییات پیادهسازی
(88)
ارزیابی مدل
(89)
نتایج آموزش شبکه عصبی نوع دوم
(90)
جزییات پیادهسازی
(90)
ارزیابی مدل
(91)
نتایج آموزش شبکه عصبی نوع اول با یادگیری بازنمایی متقابل
(92)
جزییات پیادهسازی
(92)
ارزیابی مدل
(92)
نتایج آموزش شبکه عصبی نوع دوم با یادگیری بازنمایی متقابل
(93)
جزییات پیادهسازی
(93)
ارزیابی مدل
(94)
بررسی نتایج
(95)
اثر یادگیری بازنمایی متقابل
(95)
مقایسه دو نوع شبکه عصبی
(97)
پیاده سازی الگوریتم مسیریابی در محیط گزبو
(97)
پیاده سازی شبکه عصبی بر روی ربات آرش۲
(98)
نتیجه گیری و پیشنهادها
(100)
نتیجهگیری
(100)
نوآوریها
(101)
محدودیتها و پیشنهادها برای کارهای آینده
(101)
پیوستها
(101)
هایپرپارامترهای آموزش شبکه عصبی نوع اول
(103)
هایپرپارامترهای آموزش شبکه عصبی نوع دوم
(104)
هایپرپارامترهای آموزش شبکه عصبی نوع اول با یادگیری بازنمایی متقابل
(105)
هایپرپارامترهای آموزش شبکه عصبی نوع دوم با یادگیری بازنمایی متقابل
(106)
کتابنامه
(107)