Loading...

Learning of Causal Structures with Deep Reinforcement Learning

Amirinezhad, Amir | 2020

1019 Viewed
  1. Type of Document: M.Sc. Thesis
  2. Language: Farsi
  3. Document No: 53480 (05)
  4. University: Sharif University of Technology
  5. Department: Electrical Engineering
  6. Advisor(s): Saleh Kaleybar, Saber; Hashemi, Matin
  7. Abstract:
  8. We study the problem of experiment design to learn causal structures from interventional data. We consider an active learning setting in which the experimenter decides to intervene on one of the variables in the system in each step and uses the results of the intervention to recover further causal relationships among the variables. The goal is to fully identify the causal structures with minimum number of interventions. We present the first deep reinforcement learning based solution for the problem of experiment design. In the proposed method, we embed input graphs to vectors using a graph neural network and feed them to another neural network which outputs a variable for performing intervention in each step. Both networks are trained jointly via a Q-learning algorithm. Experimental results show that the proposed method achieves competitive performance in recovering causal structures with respect to previous works, while significantly reducing execution time in dense graphs
  9. Keywords:
  10. Reinforcement Learning ; Active Learning ; Causal Structure ; Experimental Design ; Directed Acyclic Graph (DAG) ; Causal Structures Learning ; Graph Neural Network

 Digital Object List

 Bookmark

  • مقدمه‌
  • پیش‌نیازها
    • مقدمه ای بر ساختارهای علّی
      • تفاوت رابطه‌ی همبستگی و رابطه‌ی علّی
      • نمایش روابط علّی و متغیرهای محیط
      • کلاس هم‌ارزی مارکوف
      • مجموعه قوانین Meek
    • مقدمه ای بر یادگیری تقویتی
      • مفاهیم پایه
      • عامل برپایه‌ی سودمندی
      • عامل برپایه‌ی جست‌جوی سیاست
      • رقابت بین اکتشاف و بهره‌بری
    • مقدمه ای بر شبکه GNN
      • مفاهیم پایه
  • تعریف مسئله
    • معرفی اجزا و مفاهیم مسئله
    • کارهای صورت گرفته
  • راه‌حل پیشنهادی
    • بیان گراف
    • تابع امتیاز
    • آموزش
      • فرمول بندی مسئله یادگیری تقویتی
      • یادگیری تابع Q
  • نتایج
    • ساخت گراف مصنوعی علّی
    • راه‌حل های قبلی برای مقایسه عملکردها
    • جزئیات مراحل آموزش و تست
    • مقایسه نتایج
      • مقایسه میزان روابط علّی شناسایی شده
      • مقایسه زمانی
    • گراف مربوط به محیط واقعی
  • نتیجه گیری
...see more