Research Design의 중요성 Research Design (Design Based Approach) 자연적으로 그룹이 randomzie 되는 상황을 디자인하여 AB 테스트에 준하는 실험을 하는 방법 주사위 던지기같은 Exogeneous Variation으로 Treatment group과 Control group을 랜덤하게 나눔으로서 Research Design을 실현할 수 있음. 다만, Exogeneous Variation이 Outcome에 영향을 주거나 다른 Confounder가 방해하면 안됨. Outcome의 효과가 오로지 Treatment에 의한 것임을 분명히 해야 함 Design Trumps Analysis 인과추론의 퀄리티를 결정하는 것은 분석 방법, 데이터보다도 "Research Design"이다! Causal Infer.. R-squared Is Not Valid for Nonlinear Regression 가정: Explained variance (SSR) + Error variance (SSE) = Total variance (SST) linear model에서는 적합한 가정이므로 R sqaured는 0 ~ 1 사이의 값을 가짐 non linear model에서는 위배되는 가정이고 R sqaured는 0 ~ 1 사이의 값을 가지지 않음. 따라서, non linear model에서는 R sqaured가 적절한 평가 지표가 아님 출처 https://statisticsbyjim.com/regression/r-squared-invalid-nonlinear-regression/ https://m.blog.naver.com/sharp_kiss/222624070791 행동 데이터 분석 - 인과관계 다이어그램 이해하기 (chain, fork, collider + cycle) 이 글은 "행동 데이터 분석 - 플로랑 뷔송" 책의 Part2- 인과관계 다이어그램과 교란 해소 부분을을 참고하여 작성했습니다. 그 외 같이 보면 좋은 내용: https://hul980.tistory.com/121 이전에 "인과추론을 위한 데이터과학" 유튜브를 참고하여 Casual Diagram에 대해 정리한 내용 Causal Diagram 아래 동영상을 참고하여 작성했습니다. https://www.youtube.com/watch?v=ZAdr7TB1bF4 https://www.youtube.com/watch?v=nMweRDcooXI https://www.youtube.com/watch?v=rbZ4ebZCHMY 인과 그래프(Casual Diagram) Directed Acyclic Graph (DAG) 구.. 행동 데이터 분석 - 교란변수 찾기, 벅슨의 역설 이 글은 "행동 데이터 분석 - 플로랑 뷔송" 책의 Part1 - 행동의 이해 부분을을 참고하여 작성했습니다. # 적절한 교란변수를 찾아보자 데이터 출처: https://github.com/BuissonFlorent/BehavioralDataAnalysis.git GitHub - BuissonFlorent/BehavioralDataAnalysis: Support files for the O'Reilly book "Behavioral Data Analysis with R and Python" Support files for the O'Reilly book "Behavioral Data Analysis with R and Python" by Florent Buisson - GitHub - BuissonFlo.. Logistic Regression - Quasi Separation problem 아래 글을 참고하여 작성한 글입니다. 틀린 부분이 있다면 논의나 피드백은 언제나 환영입니다. https://stats.oarc.ucla.edu/other/mult-pkg/faq/general/faqwhat-is-complete-or-quasi-complete-separation-in-logistic-regression-and-what-are-some-strategies-to-deal-with-the-issue/ FAQ What is complete or quasi-complete separation in logistic regression and what are some strategies to deal with the issue? stats.oarc.ucla.edu # 문제 상황 import stats.. Matching 예시 아래 페이지를 참고하여 작성한 페이지 입니다. https://theeffectbook.net/ch-Matching.html?panelset=python-code&panelset1=python-code2&panelset2=stata-code3&panelset3=python-code3&panelset4=python-code4&panelset5=python-code5&panelset6=python-code6 Chapter 14 - Matching | The Effect Chapter 14 - Matching | The Effect is a textbook that covers the basics and concepts of research design, especially as applied to causal.. 인과추론의 다양한 접근법 아래 영상을 참고하여 작성한 글입니다. https://www.youtube.com/watch?v=rRGua7WzVog # Data Generation Process Selection on Observables selection bias를 설명하는 모든 요인이 관찰 가능하다는 가정 하에 분석하는 경우 Regression, Matching Selection on Unobservable selection bias를 설명하는 요인 중 관찰 불가능한 데이터가 있음 사후분석이 아닌 RCT처럼 연구자가 두 그룹을 randomize 하여 관찰 불가능한 요인까지 비교 가능하도록 Design-based Approach로 사전에 설계해야 함 Instrumental Variable, Quasi-Experiment, RCT e.. Matching 아래 링크를 참조하여 작성한 글입니다. https://www.youtube.com/watch?v=cMMeYBjwztg # Regression vs Matching Regression Matching 공통점 observed variable으로 control group과 treatment group의 특성을 유사하게 만들어 두 그룹을 비교 가능하게 만든다. (Selection on Observables) - regression에서는 observed variable로 두 그룹의 selection bias를 없앤다는 concept - matching에서는 propensity score로 이를 통제할 수 있다는 concept 장점 - 다양한 covariate이나 fixed effect으로 within group ..