Loading...

Deep Learning-Based Procedural Content Generation for Video Games

Morakabi Esfahani, Mohammad Hadi | 2025

0 Viewed
  1. Type of Document: M.Sc. Thesis
  2. Language: Farsi
  3. Document No: 58175 (05)
  4. University: Sharif University of Technology
  5. Department: Electrical Engineering
  6. Advisor(s): Hashemi, Matin
  7. Abstract:
  8. Procedural Content Generation (PCG) is a critical challenge in video game design, aimed at automating the creation of complex maps and levels. This thesis presents a novel deep learning-based approach for PCG that integrates transformer architectures with reinforcement learning techniques. Building on previous works, this research seeks to enhance the quality, diversity, and success rate of generated playable levels. The proposed method utilizes transformer architectures to model sequences of actions, states, and rewards, predicting optimal game content based on past trajectories. Offline datasets, generated by semi-expert agents trained in the PCGRL framework, serve as the foundation for training our model. The integration of transformers enables the model to generate coherent and meaningful maps while maintaining flexibility across various game environments. Moreover, a comprehensive analysis of stopping criteria and success rates indicates that the proposed model effectively utilizes map tiles to construct playable levels. This capability makes it a powerful tool for content generation in video games, offering a promising solution for the challenges of generating complex game content
  9. Keywords:
  10. Reinforcement Learning ; Procedural Content Generation (PCG) ; Sequence Modeling ; Two Dimentional Video Game Level Generation ; Video Games

 Digital Object List

 Bookmark

  • مقدمه
    • تولید محتوای رویّه‌ای چیست؟
    • مزایا و اهمیت PCG
    • چالش‌ها
      • ایجاد محتوای با کیفیت بالا
      • کنترل فرایند تولید
      • هزینه‌های محاسباتی
    • اهداف پژوهش و خلاصهٔ روش
  • مروری بر مفاهیم یادگیری عمیق و یادگیری تقویتی
    • آشنایی با شبکه‌های عصبی و یادگیری عمیق
      • نورون
      • شبکهٔ عصبی
      • تابع هزینه و آموزش شبکه
      • شبکهٔ عصبی کانولوشنی
    • یادگیری تقویتی
      • اجزای مسئلهٔ یادگیری تقویتی
      • توابع ارزش و معادلهٔ Bellman
      • برنامه‌ریزی پویا
      • تخمین مونته‌کارلو
      • یادگیری اختلاف موقت
      • تقریب تابع
      • گرادیان خط‌مشی
      • اقدام‌کننده-منتقد
      • بهینه‌سازی خط‌مشی در ناحیهٔ اطمینان
      • بهینه‌سازی تقریبی خط‌مشی
  • پژوهش‌های پیشین
    • تاریخچه
    • گذار به یادگیری ماشین
    • تولید محتوای رویه‌ای با یادگیری تقویتی
    • رویکردی نوین در یادگیری تقویتی
  • ایدهٔ پیشنهادی و نتایج
    • تولید محتوا به منزلهٔ گام‌های متوالی و مرتبط
    • تعریف مسئلهٔ MDP
    • مجموعهٔ دادگان
    • معماری مدل
    • آموزش
    • نتایج
    • مقایسهٔ عملکرد
...see more