Loading...
- Type of Document: M.Sc. Thesis
- Language: Farsi
- Document No: 53480 (05)
- University: Sharif University of Technology
- Department: Electrical Engineering
- Advisor(s): Saleh Kaleybar, Saber; Hashemi, Matin
- Abstract:
- We study the problem of experiment design to learn causal structures from interventional data. We consider an active learning setting in which the experimenter decides to intervene on one of the variables in the system in each step and uses the results of the intervention to recover further causal relationships among the variables. The goal is to fully identify the causal structures with minimum number of interventions. We present the first deep reinforcement learning based solution for the problem of experiment design. In the proposed method, we embed input graphs to vectors using a graph neural network and feed them to another neural network which outputs a variable for performing intervention in each step. Both networks are trained jointly via a Q-learning algorithm. Experimental results show that the proposed method achieves competitive performance in recovering causal structures with respect to previous works, while significantly reducing execution time in dense graphs
- Keywords:
- Reinforcement Learning ; Active Learning ; Causal Structure ; Experimental Design ; Directed Acyclic Graph (DAG) ; Causal Structures Learning ; Graph Neural Network
-
محتواي کتاب
- view
- مقدمه
- پیشنیازها
- مقدمه ای بر ساختارهای علّی
- تفاوت رابطهی همبستگی و رابطهی علّی
- نمایش روابط علّی و متغیرهای محیط
- کلاس همارزی مارکوف
- مجموعه قوانین Meek
- مقدمه ای بر یادگیری تقویتی
- مفاهیم پایه
- عامل برپایهی سودمندی
- عامل برپایهی جستجوی سیاست
- رقابت بین اکتشاف و بهرهبری
- مقدمه ای بر شبکه GNN
- مفاهیم پایه
- مقدمه ای بر ساختارهای علّی
- تعریف مسئله
- معرفی اجزا و مفاهیم مسئله
- کارهای صورت گرفته
- راهحل پیشنهادی
- بیان گراف
- تابع امتیاز
- آموزش
- فرمول بندی مسئله یادگیری تقویتی
- یادگیری تابع Q
- نتایج
- ساخت گراف مصنوعی علّی
- راهحل های قبلی برای مقایسه عملکردها
- جزئیات مراحل آموزش و تست
- مقایسه نتایج
- مقایسه میزان روابط علّی شناسایی شده
- مقایسه زمانی
- گراف مربوط به محیط واقعی
- نتیجه گیری