본문 바로가기

계량경제학/인과추론의 데이터과학

Causal Diagram

아래 동영상을 참고하여 작성했습니다.

https://www.youtube.com/watch?v=ZAdr7TB1bF4

https://www.youtube.com/watch?v=nMweRDcooXI

https://www.youtube.com/watch?v=rbZ4ebZCHMY


인과 그래프(Casual Diagram)

Directed Acyclic Graph (DAG)

  • 구성 요소: node, edge, directed
  • acyclic: 순환 고리가 없는 형태(역인과관계X)
  • Bayesian Network으로 인과그래프 표현

인과그래프에서 Relationship Type

  • Confounder: pre-treatment variable ↔ Collider: post-treatment variable

Causal Path와 Backdoor Path

  • causal path: X → W → Y ↔ backdoor path: causal path를 제외한 나머지 모든 path ⇒ backdoor path를 차단하여 causal inference를 추론!

Causal graph에서의 Association

  • d-separated: 두 변수 사이에 path가 막혀있음
    • (위의 X→Y path)
    • A / AB / BE를 차단하면 X와 Y는 d-separated
  • d-connected: 두 변수 사이에 path가 연결되어 있음
    • (아래의 X→Y path)
    • C / CE / AD를 차단하면 X와 Y는 d-connected → A와D를 차단하면 d-connected??

 

 

 

 

 

 

(1) Mediator (Chain)

Conditioning X Conditioning O
  • d-connected
  • Matching, Control Variable 등으로 Conditioning
  • d-separated

 

(2) Confounder (Fork)

Conditioning X Conditioning O
  • d-connected
  • d-separated

(3) Collider (Immorality)

Conditioning X Conditioning O
  • d-separated
  • d-connected
    • Z에 같은 결과가 나도록 X와 Y를 조정하면서 association이 생김
  • ⇒ 인과추론 시 Collider는 Conditioning 하지 않고 가만히 놔둬야 함!

인과그래프 활용

  • ex) 호르몬 치료가 자궁암에 영향을 준다는 연구 결과 → 호르몬 치료를 하면 자궁에 출혈이 많이 생겨서 자궁암 검사를 많이 하기 때문! ⇒ 인과그래프를 활용한 통제실험 필요
  • 의견1: 호르몬 치료가 자궁암에 영향을 준다

  • 의견2: 호르몬 치료를 하면 자궁 출혈이 많아져서 자궁암 진단이 많아진다.

→ Noncausal association1: Uterine Bleeding을 통제하면 Mediator로서 noncausal association 차단 가능

  • Noncausal association2: Uterine Bleeding이 Estrogens와 Uterine Cancer 사이에 Collider로 작용→ Uterine Bleeding을 conditioning 하면 d-connection을 일으켜서 noncausal association2가 열림. 즉, 호르몬 치료가 자궁암 진단에 영향을 줌

  • 연구 디자인으로 Estrogen → Uterine Bleeding의 연결고리를 끊으면 noncausal associaton2가 끊김
  •