분류 전체보기 (150) 썸네일형 리스트형 인과추론을 위한 회귀분석 - Polynomials https://www.notion.so/Regression-263a1a5f472c49189a8e7ceb6d8f623d 해당 내용은 위 사이트를 참고하여 작성했습니다. Polynomials OLS는 종속변수가 독립변수 사이 관계가 선형으로 설명된다고 가정함. 아래와 같이 종속변수와 독립변수 사이가 선형으로 설명되지 않을 때에도, 추가 과정을 통해 OLS를 적합할 수 있음 (1) model에 Polynomial term을 추가하기 (2) data를 transform 하기 (1) coefficient의 해석 방법 $Y =\beta_1X + \beta_2X^2+\beta_3X^3$ $\beta_1$: 나머지 변수들이 constant 할 때 $X$가 한단계 변화할 때 $Y$의 변화량의 평균 → $X$의 변화는 $.. 인과추론을 위한 회귀분석 - Discrete Variable https://www.notion.so/Regression-263a1a5f472c49189a8e7ceb6d8f623d 해당 내용은 위 사이트를 참고하여 작성했습니다. Discrete Variable이 model에 포함되어 있을 때의 주의사항 $Y = \beta_0 + \beta_1X+\beta_2Z + \epsilon$에서 Z가 discrete variable(e.g. hair color: black, blonde, red) 일 때 $\beta_2$를 어떻게 해석해야 하는가? discrete variable의 변수 변환을 어떻게 수행해야 하는가? interaction variable을 어떻게 만드는가? (1) Binary Variable의 Coefficient를 해석하는 방법 $Sales = \beta_.. 인과추론을 위한 회귀분석 - 회귀분석의 개요 https://theeffectbook.net/ch-StatisticalAdjustment.html?panelset=python-code Chapter 13 - Regression | The Effect Chapter 13 - Regression | The Effect is a textbook that covers the basics and concepts of research design, especially as applied to causal inference from observational data. theeffectbook.net 해당 내용은 위 사이트를 참고하여 작성했습니다. (1) The basic of regression 1. Error terms Residual: sample과 회귀선을.. Causal Diagram 아래 동영상을 참고하여 작성했습니다. https://www.youtube.com/watch?v=ZAdr7TB1bF4 https://www.youtube.com/watch?v=nMweRDcooXI https://www.youtube.com/watch?v=rbZ4ebZCHMY 인과 그래프(Casual Diagram) Directed Acyclic Graph (DAG) 구성 요소: node, edge, directed acyclic: 순환 고리가 없는 형태(역인과관계X) Bayesian Network으로 인과그래프 표현 인과그래프에서 Relationship Type Confounder: pre-treatment variable ↔ Collider: post-treatment variable Causal Pat.. Instrumental Variable, Control Variable, Selection Model 아래 동영상을 참고하여 작성했습니다. https://www.youtube.com/watch?v=0HUf8aH1B9Y https://www.youtube.com/watch?v=0HUf8aH1B9Y https://www.youtube.com/watch?v=fL_SBIg-bnY 도구변수(Instrumental Variable) error term과 y가 exogenous → X와 y 사이 인과관계를 찾을 수 없음 ⇒ treatment variable을 error term과 상관관계를 가지는 endogenous 한 part + 상관관계가 없는 exogeneous part으로 나눔 → exogenous 한 part만 떼어내서 인과추론 Two-stage Least Squares (1) exogenous 한 part.. Session 2: Overview of Research Design for Casual Inference https://www.youtube.com/watch?v=kr-7PXLefyc&list=PLKKkeayRo4PWyV8Gr-RcbWcis26ltIyMN&index=5 본 게시물은 '인과추론을 위한 데이터과학' Session 2를 참고하여 작성했습니다. [2-1] 인과추론을 위한 연구 디자인 Meta-Analysis: 여러 인과추론의 결과를 종합적으로 분석하는 방법론. 여러 데이터셋 → 반복적인 인과관계 → 여러 인과적 근거를 종합 Randomized Experiment (Randomized Controlled Trial, RCT): 단일 방법론 Quasi-Experiment: RCT를 실제로 수행할 수 없는 환경에서 준실험 방법 Instrumental Variable: 인위적인 도구변수(인과추론을 방해하는.. BERT(Bidirectional Encoder Representation from Transformer) https://www.youtube.com/watch?v=IwtexRHoWG0&t=318s 위 동영상을 참고하여 작성했습니다. BERT Bert는 transformer의 encoder 파트로만 이루어진 모델이다. Pre - training Masked Language Model (MLM): 단어에 random하게 mask를 부여하여 학습 Next Sentence Prediction (NSP): corpus에서 sentence와 sentence가 연속된 문장인 지 학습 Fine tuning: Bert에 NLP task의 목적에 맞게 맨 마지막 layer을 쌓는 과정 Input / Output Representation Bert의 input으로 sentence를 하나 또는 여러 개 넣을 수 있다. Pre-t.. LSTM 실습: reuters 예제 import tensorflow as tf from tensorflow import keras from tensorflow.keras.datasets import reuters (X_train,y_train),(X_test,y_test) = reuters.load_data(num_words=10000, test_split=0.2) keras에서 제공하는 로이터 뉴스 데이터는 뉴스 기사 텍스트로 46개의 뉴스 토픽을 분류하는 예제이다. keras.datasets에서 reuters를 불러왔다. print(X_train.shape) print(y_train.shape) print(X_test.shape) print(y_test.shape) (8982,) (8982,) (2246,) (2246,)으로, 약 4:.. 이전 1 2 3 4 5 6 7 8 ··· 19 다음