본문 바로가기

전체 글

(149)
2주차. Vectorization Vectorization - for 문으로 관측치 하나하나 계산을 하는 것보다 벡터 형태로 만들어서 계산을 하는게 훨씬 빠르고 계산 비용이 적게 든다. - SIMD(simple instruction multiple data): GPU, CPU에서 계산 속도가 빨라진다. More Vectorization Examples - A가 행렬, v가 벡터일 때 np.dot(A,v)로 행렬의 곱 계산 가능 - element wise 하게 여러 계산을 적용할 수 있다. u=np.exp(v) u=np.log(v) u=np.abs(v) v의 모든 element에 exp, log, abs 등의 계산을 적용할 수 있다. Vectorizing Logistic Regression logistic regression에서도 forw..
2주차. Logistic Regression as a Neural Network Binary classification 사진이 고양이인지(1) 아닌지(0)를 분류하기 위한 neural network를 만들려고 한다. 이진 분류 문제(binary classification)는 machine learning model 중 logistic regression을 사용하면 된다. input data는 사진이기 때문에 사진의 색깔을 64*64 행렬의 r,g,b 값을 3차원의 array로 받는다. 이를 하나의 길다란 벡터로 만들어서 사용한다. nx는 벡터로 만든 input data의 길이로, 여기선 64*64*3=12288이 된다. 이 X 벡터를 neural network 안에 넣어서 y(0 또는 1)을 예측할 것이다. 하나의 example에 대해서 X는 nx*1짜리 벡터이다. 우리는 여러개의 ..
1주차. Deep Learning introduction housing price를 예측하기 위한 신경망을 구현한다고 하자. 왼쪽은 집의 크기에 대한 집 가격의 그래프이고 집의 가격이 음수가 나올 수 없기 때문에 ReLU함수와 비슷한 꼴의 그래프를 그릴 수 있다. 집의 크기 외에도 다른 변수들을 고려했을 때 집값 예측을 신경망으로 어떻게 할 수 있는 지 살펴보자. 집의 크기와 방의 수는 family size라는 변수로 정의될 수 있고, 주소는 도보 이용 가능성, 주소와 재산은 교육의 질이라는 새로운 변수로 정의될 수 있다. 이러한 모든 변수들이 집의 가격이라는 예측으로 나타날 수 있다. 이처럼 신경망에서 x1, x2..의 입력층(input layer)에 따라 hidden layer의 노드들이 영향을 받고 여러 층에서 신호 전달을 거쳐 집값이라는 y의 예측값이 ..
4장 신경망 학습 4.1 신경망 학습 3단원에서는 이미 W와 b에 대해 최적의 값이 찾아져 있었고 그 값으로 X에서 Y를 예측한 후 실제 Y값과 비교하여 정확도를 예측하고, 이 과정을 배치처리로도 해보았다. 4단원 에서는 gradient descent 과정을 거치면서 Loss function을 최소화 하기 위한 W와 b값을 점진적으로 학습할 것이다. - 2장의 퍼셉트론에서는, 가중치와 편향의 값을 직접 설정했지만 실제로는 직접 설정하지 못하고, 기계학습을 통해 기계가 스스로 적절한 가중치와 편향 값을 학습하여야 한다. (end-to-end 방식: 입력부터 출력까지 사람의 개입 없이 기계가 학습한다.) - 데이터를 train set과 test set으로 나누는 이유: 모델의 범용성을 평가하기 위함 4.2 손실 함수 4.2...
3장 신경망 3.1 신경망 신경망은 퍼셉트론을 여러 층 쌓아서 만든 거대한 분류기를 말한다. 첫번째 층을 입력층, 마지막 층을 출력층이라 하고 중간의 모든 층들을 은닉층이라고 한다. 입력층은 0층에서부터 시작해서 1층, 2층, ...의 순으로 나아간다. 은닉층과 출력층은 입력 신호에 가중치를 곱하고 편향을 더한 뒤에 함수로 가공해서 출력 신호를 만드는데 이 때 가공하는 함수를 활성화 함수라고 한다. 퍼셉트론은 단층 퍼셉트론과 다층 퍼셉트론으로 나눌 수 있는데, 단층 퍼셉트론에서는 지난 2단원에서 했던, 단 한 개의 층만으로 나타나는 AND, OR 게이트와 같은 퍼셉트론을 말하고(입력값을 경계로 출력이 바뀌는 함수), 다층 퍼셉트론은 XOR 게이트처럼 퍼셉트론 여러 개가필요한, 단층 퍼셉트론에서 층을 더 쌓아서 신경망..