아래 글을 참고하여 작성한 글입니다.
# Inverse Probability Weighting (IPW)
- matching은 propensity score가 비슷한 sample들을 resample하여 두 그룹을 비교하는 반면 [sample 수를 줄임], IPW는 propensity score의 역수만큼을 각 관측치에 weight을 줌 [sample 수를 가상으로 늘림]
- treatment를 받을 확률이 적은 그룹에는 더 많은 가중치를 부여하고, treatment를 받을 확률이 높은 그룹에게는 가중치를 적게 부여함.
- 모든 sample을 유지하는 것을 넘어서 pseudo sample을 만들기 때문에 추정치의 variation을 작아지도록 하지만 bias는 높아짐
- matching, regression을 쓸 수 없는 상황에도 편하게 사용할 수 있음
(1) RCT의 경우
- 성별이 outcome에 관계가 없어서 confounding factor가 되지 않음
(2) Natural Experiment의 경우
- 성별이 outcome에 영향을 주는 confounding factor. 성별에 따른 ramdomize가 이루어지지 않았기에 성별에 대한 selection bias가 있는 상태
(3) IPW 방법
- weight를 계산하는 방법
- 각 unit에 대한 propensity score를 구한다. (probability of treatment)
- propensity score의 inverse으로 각 unit에게 줄 weight를 구한다.
- weight으로 pseudo population을 만듦
- ex) Treatment=1인 여성의 weight 계산하기
- propensity score = Pr(T=1|Female) = 3/4
- weight = 4/3
- 더이상 성별이 outcome에 영향을 주지 않고 성별에 대해서는 두 집단이 비교 가능해짐
- IPW의 문제점
- Repeat Sampling: 표본을 인위적으로 늘려서 추정치의 variation이 낮아지지만 bias가 높아지는 문제
# Stabilized IPW
- weighting을 통해 gender의 confounding 역할을 제거하지만, sample 수가 인위적으로 커지는 것을 방지하는 IPW 방법
# Covariate가 여러개일 때 IPW
- 성별 뿐 아니라 나이도 confounding factor로서 작동하는 경우를 생각해보자
- Age는 연속형 변수이기 때문에 위에서처럼 conditioning 한 뒤 probability를 구하기 어려움
- logistic regression을 통해 probability score를 구한다
- Treatment = logit(Age + Sex)의 모델을 적합한 뒤, 모든 unit의 treatment를 받을 확률 (propensity score)를 구함
# Propensity Score를 사용하여 분석할 때의 이점
(1) propensity score으로 population을 trim하여 더 좋은 결과를 낼 수 있다.
- Treated unit과 Untreated unit의 propensity score의 distribution을 나타낸 plot
- Untreated unit에서 propensity score이 0에 가까운 sample (treatment를 받을 확률이 매우 적은 그룹)은 Never Treated 집단, Treated unit에서 propensity score이 1에 가까운 sample (treatment를 받을 확률이 매우 큰 그룹)은 Always treated 집단이다. 이 두 집단은 average treatment effect 분석 시 과도한 영향력을 나타낼 수 있음.
- propensity score을 기반으로 이 두 집단을 모집단에서 제거한 뒤 분석할 수 있음.
(2) Propensity Score으로 Treatment와 개인의 성향 간 관계를 파악할 수 있다.
(3) Propensity Score Calibration은 main study의 robustness를 향상시킬 수 있다.
- validation study에서는 propensity score에 대한 더 믿을만한 추정치를 만들 수 있다. <- ??