본문 바로가기

전체 글

(149)
인과추론을 위한 회귀분석 - Collinearity 아래 링크를 참고하여 작성했습니다. https://theeffectbook.net/ch-StatisticalAdjustment.html?panelset5=python-code6&panelset6=python-code7&panelset7=python-code8&panelset8=python-code9#additional-regression-concerns Collinearity의 종류 (1) Perfect Multicollinearity 변수들의 linear combination이 다른 변수를 정확하게 예측할 수 있는 경우 (e.g. X1 = 2X2 + 3X3 - X4) 변수들간 correlation이 -1 또는 1 (2) Not Perfect Multicollinearity 변수들간 correlation..
인과추론을 위한 회귀분석 - Sample Weights https://theeffectbook.net/ch-StatisticalAdjustment.html?panelset5=python-code6&panelset6=python-code7&panelset7=python-code8#additional-regression-concerns Chapter 13 - Regression | The Effect Chapter 13 - Regression | The Effect is a textbook that covers the basics and concepts of research design, especially as applied to causal inference from observational data. theeffectbook.net Sample Weight..
Gauss-Markov Assumptions Gauss-Markov Theorem이란? 회귀분석에서 Gauss-Markov Assumptions을 만족하면 Ordinary Least Squares로 추정한 coefficient가 BLUE(Best Linear Unbiased Estimator)를 만족한다. Ordinary Least Squares (OLS): Least Square Method라고도 불리며, 오차의 제곱의 합이 최소가 되는 회귀계수를 추정하는 방법 BLUE(Best Linear Unbiased Estimator): 선형이고 불편성을 만족하는 추정량 중 BLUE 추정량의 분산이 가장 작음 다시 말해서, Gauss-Markov Theorem은 회귀계수를 OLS로 추정할 때의 유효성을 보장함. Gauss-Markov Assumption이..
인과추론을 위한 회귀분석 - Standard Error을 어떻게 고치면 되는가? https://theeffectbook.net/ch-StatisticalAdjustment.html 해당 내용은 위 링크를 토대로 작성되었습니다. error term의 iid 가정이 깨졌을 때 취할 수 있는 방법들을 알아보자. Hetero-skedasticity가 있을 때의 문제점 error term $\epsilon$의 분산이 X의 값에 따라서 달라지는 경우 Standard error을 계산할때 분산이 더 높은 영역에서 Y의 조건부 평균이 왔다갔다함 → 일반 OLS 표준편차는 분산이 높은 영역의 표준편차를 따로 계산하는 것이 아니라, 전체 범위에서의 표준편차를 계산하기 때문에 표준편차를 과소평가 하게 됨 (왼쪽 플랏부터 A, B라고 할 때) A, B는 전체 X 범위에서 Y의 표준편차가 동일하지만 A: ..
인과추론을 위한 회귀분석 - Standard Error의 정의와 가정 https://theeffectbook.net/ch-StatisticalAdjustment.html 해당 내용은 위 링크를 참고하여 작성했습니다. Standard Error이란? Standard Error(표준 오차): 회귀계수의 standard deviation (표준 편차) Standard Deviation (표준편차) vs Standard Error (표준 오차) Standard Deviation (S.D.): 데이터의 퍼져있는 정도를 나타낼 때 사용 Standard Error (S.E.): 추정치의 표준편차를 나타낼 때 사용. e.g.) 표본 평균의 퍼져있는 정도를 계산할 때 → 표본 평균은 추정치이므로 Standard Deviation이 아니라 Standard Error을 사용 회귀분석 시 추정..
인과추론을 위한 회귀분석 - 상호작용항 https://theeffectbook.net/ch-StatisticalAdjustment.html?panelset=python-code&panelset1=python-code2&panelset2=python-code3 해당 내용은 위 링크를 참고하여 작성했습니다. 상호작용항 :Y와 X의 관계가 X가 아닌 Z에 의해 변화한다면? $Y = \beta_0 + \beta_1X + \beta_2Z + \beta_3XZ + \epsilon$ e.g. 휘발유 가격(X)과 주행 마일(Y)의 관계는 자동차 소유 여부(Z)에 의해 달라짐 → X와 Z의 상호작용 관계까지 변수에 추가해야 함 Interaction Terms의 해석 (1) - X가 Z와 상호작용 효과가 있을 때, X의 효과는 어떻게 해석해야 하는가? Y에 대..
인과추론을 위한 회귀분석 - 변수 변환 https://theeffectbook.net/ch-StatisticalAdjustment.html?panelset=python-code Chapter 13 - Regression | The Effect Chapter 13 - Regression | The Effect is a textbook that covers the basics and concepts of research design, especially as applied to causal inference from observational data. theeffectbook.net 해당 내용은 위 사이트를 참고하여 작성했습니다. 변수 변환 앞선 "인과추론을 위한 회귀분석 - Polynomials" 에서처럼 모델에 변수의 polynomial 항을..
인과추론을 위한 회귀분석 - Polynomials https://www.notion.so/Regression-263a1a5f472c49189a8e7ceb6d8f623d 해당 내용은 위 사이트를 참고하여 작성했습니다. Polynomials OLS는 종속변수가 독립변수 사이 관계가 선형으로 설명된다고 가정함. 아래와 같이 종속변수와 독립변수 사이가 선형으로 설명되지 않을 때에도, 추가 과정을 통해 OLS를 적합할 수 있음 (1) model에 Polynomial term을 추가하기 (2) data를 transform 하기 (1) coefficient의 해석 방법 $Y =\beta_1X + \beta_2X^2+\beta_3X^3$ $\beta_1$: 나머지 변수들이 constant 할 때 $X$가 한단계 변화할 때 $Y$의 변화량의 평균 → $X$의 변화는 $..