Loading...
Estimation and Inference of Heterogeneous Treatment Effects using Random Forests
Ghodrati, Mohsen | 2024
0
Viewed
- Type of Document: M.Sc. Thesis
- Language: Farsi
- Document No: 57465 (02)
- University: Sharif University of Technology
- Department: Mathematical Sciences
- Advisor(s): Haji Mirsadeghi, Mir Omid
- Abstract:
- Sometimes, the relationship between two random variables is not a correlation, but, a causal relationship where only changes in one of the two variables can lead to changes in the second one. The importance of examining such cause-effect relationships lies in the fact that sometimes, beyond just knowing the correlation between two variables, we are looking for an active effect on one, and knowing whether or not other correlated variables will also change with the change of this variable is of key importance. Such a process of exploring and analyzing cause-effect relationships is called causal learning. Based on this, in this thesis, we will first review the methods of causal inference, as a crucial part of causal learning. Therefore, conditions on which machine learning methods can assist causal inference are studied and determined. Assuming these conditions, a couple of methods for estimating the Average Treatment Effect are introduced. We will then conclude the first half of this thesis by focusing on estimating methods with asymptotic inference possibilities. Meaning that we desire methods that not only are unbiased but also have competitive convergence rates. In the second half of this thesis, we will examine the problem of estimating the effect of treatment in a heterogeneous setting, that is, a setting where there is a variety of quantities and methods of treatment among the people of the same sample. Following this path, as we will see, parametric methods are not suitable even though they are fast. Because, in cases where the problem's settings do not match with such a parametric modeling, bias in the final estimation is unavoidable. Thus, we will be paying attention to non-parametric methods, such as random forests, and introduce two growing patterns suitable for causal inference which are both unbiased estimators and guarantee convergence to normal
- Keywords:
- Causal Inference ; Nonparametric Method ; Heterogeneous Treatment Effect ; Average Treatment Effect ; Generalized Random Forests
-
محتواي کتاب
- view
- مقدمه
- نتایج و مباحث اصلی
- مرور ادبیات
- مفاهيم و تعاريف اوليه
- روابط و استنتاج علّی
- انگیزههای استفاده از استنتاج علّی
- چارچوب پیامدهای بالقوه و مساله بنیادی استنتاج علّی
- شرطهای لازم برای بهرهبرداری از روشهای یادگیری ماشین
- پارادایم کلی یادگیری علّی
- روابط و استنتاج علّی
- برآورد و استنباط آماری میانگین اثر درمان
- کارآزمایی تصادفیشده کنترلدار
- برآوردگر اختلاف میانگینها DM
- برآوردگر خطی OLS
- شرط عدم درآمیختگی و نتایج آن
- فراتر از یک کارآزمایی تصادفیشده کنترلدار
- تلفیق برآوردگرهای اختلاف میانگینها
- عدم درآمیختگی در حالت پیوسته بودن X
- برآورد بر پایه نمره تمایل (به درمان)
- قشربندی نمره تمایل و برآوردگر STRAT
- روش جورسازی نمره تمایل
- روش وزندهی با وارون نمره تمایل و برآوردگر IPW
- برآورد استوار میانگین اثر درمان با AIPW
- وزندهی با وارون نمره تمایل تقویتشده
- استواری مضاعف
- ایده برازش متقاطع
- کارآزمایی تصادفیشده کنترلدار
- استراتژیهای یادگیری اثر درمان ناهمگن
- فراالگوریتمها
- چارچوب و تعاریف اولیه
- برآوردگرهای ابتدایی یادگیرنده-T و یادگیرنده-S
- برآوردگرهای یادگیرنده-X
- چالش اریبی ناشی از منظمسازی
- ایده آموزش با نمونهگیری متقاطع
- برآوردگرهای یادگیرنده-R
- دگرسازی رابینسون
- تابع هزینه هزینه-R
- دیگر کاربردهای هزینه-R
- فراالگوریتمها
- استنباط اثر درمان ناهمگن با جنگلهای علّی
- جنگلهای تصادفی با تضمینهای مجانبی
- جنگلهای تصادفی واگر
- ناریبی به شرط وجود راستگویی
- همگرایی به توزیع گاوسی در ها-WRF
- استفاده از ها-WRF به عنوان جنگلهای علّی
- جنگلهای تصادفی تعمیمیافته
- صورتبندی مساله
- تعبیر همسایگی درختی
- تقسیمبندی بازگشتی در جنگلهای تصادفی تعمیمیافته
- الگوریتم جنگلهای تصادفی تعمیمیافته
- جنگلهای تصادفی با تضمینهای مجانبی
- افقهای آینده
- کتابنامه
- واژهنامه (فارسی به انگلیسی)
- واژهنامه (انگلیسی به فارسی)
- پیوست: آمار حدی