아래 영상을 참고하여 작성한 글입니다.
https://www.youtube.com/watch?v=rRGua7WzVog
# Data Generation Process
Selection on Observables
- selection bias를 설명하는 모든 요인이 관찰 가능하다는 가정 하에 분석하는 경우
- Regression, Matching
Selection on Unobservable
- selection bias를 설명하는 요인 중 관찰 불가능한 데이터가 있음
- 사후분석이 아닌 RCT처럼 연구자가 두 그룹을 randomize 하여 관찰 불가능한 요인까지 비교 가능하도록 Design-based Approach로 사전에 설계해야 함
- Instrumental Variable, Quasi-Experiment, RCT
- ex) 뉴저지와 펜실베니아는 서로 인접해있으며 사회적인 배경이 매우 유사함. 전자는 최저임금 법안이 통과된 treatment group, 후자는 control group임 -> random assign 된 효과를 가져가서 Quasi-Experiment를 수행할 수 있음
# Hierarchy of Causal Inference
# Selection on Observable/Unobservable의 예시
주제: 기업의 ISO 인증이 성과에 미치는 영향
단순 descriptive statistics로 확인한다면, 두 그룹이 ISO 인증 여부 외에 비교 가능하다는 확신이 없음. -> 적절한 control group을 찾아서 treatment group에 대한 counterfactual을 잘 정의하는 것이 관건이 될 것이다.
Selection on Observable로 분석하는 경우
8가지 변수가 ISO 인증을 받는지 여부를 설명할 수 있으며, 이 외에 ISO 인증 여부를 설명할 수 있는 unobservable variable이 없다고 해보자. -> 분석의 신뢰성이 여기에 달렸다!
8가지 변수를 input으로, ISO 인증 여부를 output으로 하여 기업 별 propensity score를 구하고, propensity score의 정도에 따라 matched group을 설정하고 ATE를 계산한다.
Selection on unobservable로 분석하는 경우
DID: 두 그룹의 인증 전후 데이터가 있을 때
RD: 인증 점수 커트라인을 기준으로 ISO 합격 여부가 달라진다고 할 때, 커트라인보다 약간 높은 기업과 약간 낮은 기업을 뽑아서 두 그룹 간 효과 차이를 구한다.
'계량경제학 > 인과추론의 데이터과학' 카테고리의 다른 글
Logistic Regression - Quasi Separation problem (1) | 2023.11.25 |
---|---|
Matching 예시 (0) | 2023.11.21 |
Matching (0) | 2023.11.19 |
Causal Inference를 위한 Fixed Effects (0) | 2023.11.13 |
인과추론 영역에서의 Data Structure (1) | 2023.11.13 |