본문 바로가기

전체 글

(149)
R-squared Is Not Valid for Nonlinear Regression 가정: Explained variance (SSR) + Error variance (SSE) = Total variance (SST) linear model에서는 적합한 가정이므로 R sqaured는 0 ~ 1 사이의 값을 가짐 non linear model에서는 위배되는 가정이고 R sqaured는 0 ~ 1 사이의 값을 가지지 않음. 따라서, non linear model에서는 R sqaured가 적절한 평가 지표가 아님 출처 https://statisticsbyjim.com/regression/r-squared-invalid-nonlinear-regression/ https://m.blog.naver.com/sharp_kiss/222624070791
행동 데이터 분석 - 인과관계 다이어그램 이해하기 (chain, fork, collider + cycle) 이 글은 "행동 데이터 분석 - 플로랑 뷔송" 책의 Part2- 인과관계 다이어그램과 교란 해소 부분을을 참고하여 작성했습니다. 그 외 같이 보면 좋은 내용: https://hul980.tistory.com/121 이전에 "인과추론을 위한 데이터과학" 유튜브를 참고하여 Casual Diagram에 대해 정리한 내용 Causal Diagram 아래 동영상을 참고하여 작성했습니다. https://www.youtube.com/watch?v=ZAdr7TB1bF4 https://www.youtube.com/watch?v=nMweRDcooXI https://www.youtube.com/watch?v=rbZ4ebZCHMY 인과 그래프(Casual Diagram) Directed Acyclic Graph (DAG) 구..
행동 데이터 분석 - 교란변수 찾기, 벅슨의 역설 이 글은 "행동 데이터 분석 - 플로랑 뷔송" 책의 Part1 - 행동의 이해 부분을을 참고하여 작성했습니다. # 적절한 교란변수를 찾아보자 데이터 출처: https://github.com/BuissonFlorent/BehavioralDataAnalysis.git GitHub - BuissonFlorent/BehavioralDataAnalysis: Support files for the O'Reilly book "Behavioral Data Analysis with R and Python" Support files for the O'Reilly book "Behavioral Data Analysis with R and Python" by Florent Buisson - GitHub - BuissonFlo..
Logistic Regression - Quasi Separation problem 아래 글을 참고하여 작성한 글입니다. 틀린 부분이 있다면 논의나 피드백은 언제나 환영입니다. https://stats.oarc.ucla.edu/other/mult-pkg/faq/general/faqwhat-is-complete-or-quasi-complete-separation-in-logistic-regression-and-what-are-some-strategies-to-deal-with-the-issue/ FAQ What is complete or quasi-complete separation in logistic regression and what are some strategies to deal with the issue? stats.oarc.ucla.edu # 문제 상황 import stats..
Matching 예시 아래 페이지를 참고하여 작성한 페이지 입니다. https://theeffectbook.net/ch-Matching.html?panelset=python-code&panelset1=python-code2&panelset2=stata-code3&panelset3=python-code3&panelset4=python-code4&panelset5=python-code5&panelset6=python-code6 Chapter 14 - Matching | The Effect Chapter 14 - Matching | The Effect is a textbook that covers the basics and concepts of research design, especially as applied to causal..
인과추론의 다양한 접근법 아래 영상을 참고하여 작성한 글입니다. https://www.youtube.com/watch?v=rRGua7WzVog # Data Generation Process Selection on Observables selection bias를 설명하는 모든 요인이 관찰 가능하다는 가정 하에 분석하는 경우 Regression, Matching Selection on Unobservable selection bias를 설명하는 요인 중 관찰 불가능한 데이터가 있음 사후분석이 아닌 RCT처럼 연구자가 두 그룹을 randomize 하여 관찰 불가능한 요인까지 비교 가능하도록 Design-based Approach로 사전에 설계해야 함 Instrumental Variable, Quasi-Experiment, RCT e..
Matching 아래 링크를 참조하여 작성한 글입니다. https://www.youtube.com/watch?v=cMMeYBjwztg # Regression vs Matching Regression Matching 공통점 observed variable으로 control group과 treatment group의 특성을 유사하게 만들어 두 그룹을 비교 가능하게 만든다. (Selection on Observables) - regression에서는 observed variable로 두 그룹의 selection bias를 없앤다는 concept - matching에서는 propensity score로 이를 통제할 수 있다는 concept 장점 - 다양한 covariate이나 fixed effect으로 within group ..
Inverse Probability Weighting 아래 글을 참고하여 작성한 글입니다. https://towardsdatascience.com/understanding-inverse-probability-of-treatment-weighting-iptw-in-causal-inference-4e69692bce7e Understanding Inverse Probability of Treatment Weighting (IPTW) in Causal Inference An Intuitive Explanation of IPTW and a Comparison to Multivariate Regression towardsdatascience.com # Inverse Probability Weighting (IPW) matching은 propensity score가 비..