Loading...
Deep Learning-Based Procedural Content Generation for Video Games
Morakabi Esfahani, Mohammad Hadi | 2025
0
Viewed
- Type of Document: M.Sc. Thesis
- Language: Farsi
- Document No: 58175 (05)
- University: Sharif University of Technology
- Department: Electrical Engineering
- Advisor(s): Hashemi, Matin
- Abstract:
- Procedural Content Generation (PCG) is a critical challenge in video game design, aimed at automating the creation of complex maps and levels. This thesis presents a novel deep learning-based approach for PCG that integrates transformer architectures with reinforcement learning techniques. Building on previous works, this research seeks to enhance the quality, diversity, and success rate of generated playable levels. The proposed method utilizes transformer architectures to model sequences of actions, states, and rewards, predicting optimal game content based on past trajectories. Offline datasets, generated by semi-expert agents trained in the PCGRL framework, serve as the foundation for training our model. The integration of transformers enables the model to generate coherent and meaningful maps while maintaining flexibility across various game environments. Moreover, a comprehensive analysis of stopping criteria and success rates indicates that the proposed model effectively utilizes map tiles to construct playable levels. This capability makes it a powerful tool for content generation in video games, offering a promising solution for the challenges of generating complex game content
- Keywords:
- Reinforcement Learning ; Procedural Content Generation (PCG) ; Sequence Modeling ; Two Dimentional Video Game Level Generation ; Video Games
-
محتواي کتاب
- view
- مقدمه
- تولید محتوای رویّهای چیست؟
- مزایا و اهمیت PCG
- چالشها
- ایجاد محتوای با کیفیت بالا
- کنترل فرایند تولید
- هزینههای محاسباتی
- اهداف پژوهش و خلاصهٔ روش
- مروری بر مفاهیم یادگیری عمیق و یادگیری تقویتی
- آشنایی با شبکههای عصبی و یادگیری عمیق
- نورون
- شبکهٔ عصبی
- تابع هزینه و آموزش شبکه
- شبکهٔ عصبی کانولوشنی
- یادگیری تقویتی
- اجزای مسئلهٔ یادگیری تقویتی
- توابع ارزش و معادلهٔ Bellman
- برنامهریزی پویا
- تخمین مونتهکارلو
- یادگیری اختلاف موقت
- تقریب تابع
- گرادیان خطمشی
- اقدامکننده-منتقد
- بهینهسازی خطمشی در ناحیهٔ اطمینان
- بهینهسازی تقریبی خطمشی
- آشنایی با شبکههای عصبی و یادگیری عمیق
- پژوهشهای پیشین
- تاریخچه
- گذار به یادگیری ماشین
- تولید محتوای رویهای با یادگیری تقویتی
- رویکردی نوین در یادگیری تقویتی
- ایدهٔ پیشنهادی و نتایج
- تولید محتوا به منزلهٔ گامهای متوالی و مرتبط
- تعریف مسئلهٔ MDP
- مجموعهٔ دادگان
- معماری مدل
- آموزش
- نتایج
- مقایسهٔ عملکرد
