본문 바로가기

계량경제학/인과추론의 데이터과학

인과추론의 다양한 접근법

아래 영상을 참고하여 작성한 글입니다.

https://www.youtube.com/watch?v=rRGua7WzVog

 

 


# Data Generation Process 

Selection on Observables

  • selection bias를 설명하는 모든 요인이 관찰 가능하다는 가정 하에 분석하는 경우
  • Regression, Matching 

Selection on Unobservable 

  • selection bias를 설명하는 요인 중 관찰 불가능한 데이터가 있음
  • 사후분석이 아닌 RCT처럼 연구자가 두 그룹을 randomize 하여 관찰 불가능한 요인까지 비교 가능하도록 Design-based Approach로 사전에 설계해야 함 
  • Instrumental Variable, Quasi-Experiment, RCT 
  • ex) 뉴저지와 펜실베니아는 서로 인접해있으며 사회적인 배경이 매우 유사함. 전자는 최저임금 법안이 통과된 treatment group, 후자는 control group임 -> random assign 된 효과를 가져가서 Quasi-Experiment를 수행할 수 있음 

# Hierarchy of Causal Inference

 

# Selection on Observable/Unobservable의 예시

주제: 기업의 ISO 인증이 성과에 미치는 영향 

단순 descriptive statistics로 확인한다면, 두 그룹이 ISO 인증 여부 외에 비교 가능하다는 확신이 없음. -> 적절한 control group을 찾아서 treatment group에 대한 counterfactual을 잘 정의하는 것이 관건이 될 것이다. 

Selection on Observable로 분석하는 경우 

8가지 변수가 ISO 인증을 받는지 여부를 설명할 수 있으며, 이 외에 ISO 인증 여부를 설명할 수 있는 unobservable variable이 없다고 해보자. -> 분석의 신뢰성이 여기에 달렸다! 

8가지 변수를 input으로, ISO 인증 여부를 output으로 하여 기업 별 propensity score를 구하고, propensity score의 정도에 따라 matched group을 설정하고 ATE를 계산한다. 

 

Selection on unobservable로 분석하는 경우

DID: 두 그룹의 인증 전후 데이터가 있을 때 

RD: 인증 점수 커트라인을 기준으로 ISO 합격 여부가 달라진다고 할 때, 커트라인보다 약간 높은 기업과 약간 낮은 기업을 뽑아서 두 그룹 간 효과 차이를 구한다.