계량경제학 (35) 썸네일형 리스트형 행동 데이터 분석 - 인과관계 다이어그램 이해하기 (chain, fork, collider + cycle) 이 글은 "행동 데이터 분석 - 플로랑 뷔송" 책의 Part2- 인과관계 다이어그램과 교란 해소 부분을을 참고하여 작성했습니다. 그 외 같이 보면 좋은 내용: https://hul980.tistory.com/121 이전에 "인과추론을 위한 데이터과학" 유튜브를 참고하여 Casual Diagram에 대해 정리한 내용 Causal Diagram 아래 동영상을 참고하여 작성했습니다. https://www.youtube.com/watch?v=ZAdr7TB1bF4 https://www.youtube.com/watch?v=nMweRDcooXI https://www.youtube.com/watch?v=rbZ4ebZCHMY 인과 그래프(Casual Diagram) Directed Acyclic Graph (DAG) 구.. 행동 데이터 분석 - 교란변수 찾기, 벅슨의 역설 이 글은 "행동 데이터 분석 - 플로랑 뷔송" 책의 Part1 - 행동의 이해 부분을을 참고하여 작성했습니다. # 적절한 교란변수를 찾아보자 데이터 출처: https://github.com/BuissonFlorent/BehavioralDataAnalysis.git GitHub - BuissonFlorent/BehavioralDataAnalysis: Support files for the O'Reilly book "Behavioral Data Analysis with R and Python" Support files for the O'Reilly book "Behavioral Data Analysis with R and Python" by Florent Buisson - GitHub - BuissonFlo.. Logistic Regression - Quasi Separation problem 아래 글을 참고하여 작성한 글입니다. 틀린 부분이 있다면 논의나 피드백은 언제나 환영입니다. https://stats.oarc.ucla.edu/other/mult-pkg/faq/general/faqwhat-is-complete-or-quasi-complete-separation-in-logistic-regression-and-what-are-some-strategies-to-deal-with-the-issue/ FAQ What is complete or quasi-complete separation in logistic regression and what are some strategies to deal with the issue? stats.oarc.ucla.edu # 문제 상황 import stats.. Matching 예시 아래 페이지를 참고하여 작성한 페이지 입니다. https://theeffectbook.net/ch-Matching.html?panelset=python-code&panelset1=python-code2&panelset2=stata-code3&panelset3=python-code3&panelset4=python-code4&panelset5=python-code5&panelset6=python-code6 Chapter 14 - Matching | The Effect Chapter 14 - Matching | The Effect is a textbook that covers the basics and concepts of research design, especially as applied to causal.. 인과추론의 다양한 접근법 아래 영상을 참고하여 작성한 글입니다. https://www.youtube.com/watch?v=rRGua7WzVog # Data Generation Process Selection on Observables selection bias를 설명하는 모든 요인이 관찰 가능하다는 가정 하에 분석하는 경우 Regression, Matching Selection on Unobservable selection bias를 설명하는 요인 중 관찰 불가능한 데이터가 있음 사후분석이 아닌 RCT처럼 연구자가 두 그룹을 randomize 하여 관찰 불가능한 요인까지 비교 가능하도록 Design-based Approach로 사전에 설계해야 함 Instrumental Variable, Quasi-Experiment, RCT e.. Matching 아래 링크를 참조하여 작성한 글입니다. https://www.youtube.com/watch?v=cMMeYBjwztg # Regression vs Matching Regression Matching 공통점 observed variable으로 control group과 treatment group의 특성을 유사하게 만들어 두 그룹을 비교 가능하게 만든다. (Selection on Observables) - regression에서는 observed variable로 두 그룹의 selection bias를 없앤다는 concept - matching에서는 propensity score로 이를 통제할 수 있다는 concept 장점 - 다양한 covariate이나 fixed effect으로 within group .. Causal Inference를 위한 Fixed Effects 유튜브 "인과추론의 데이터과학"을 듣고 작성했습니다. 데이터 예시: 푸시메시지가 구매에 미치는 영향 unit fixed effect: time invariant covariates를 모두 통제하여 time invariant covariates를 모두 설명할 수 있음. 즉, time invariants covariate과 perfect collinearity를 가짐 ex) Gender = 1 * D1 + 0 * D2 + 1 * D3 (20+30)/2 = 25 customer3에서는 Y1이 없기 때문에 treatment effect를 계산할 수 없음 -> customer fixed effect는 within group comparison을 하는 역할을 수행 Q3. customer fixed effect 있을.. 인과추론 영역에서의 Data Structure 유튜브 "인과추론을 위한 데이터과학"을 보고 작성했습니다. # Data Structure # Time Series Data treatment를 받은 하나의 unit에 대한 데이터만 있음 Control group이 없음: 시간에 따라 effect가 달라지는 것이 treatment에 의한 변화인지, time trend에 의한 변화인지 판단하기 어려움. seasonal effect 등의 가정을 해야 하는 데 가정을 검증하기도 어려움. -> Time Series Data는 인과추론이 어려움 # Cross Sectional Data Treatment 이후 시점에 대해서 여러개의 unit 데이터로 구성됨 counterfactual로 Control group을 선정하기 위해서는 time-variang confound.. 이전 1 2 3 4 5 다음