본문 바로가기

분류 전체보기

(150)
CNN 실습: mnist 예제 import numpy as np import pandas as pd import tensorflow as tf from tensorflow import keras from sklearn.datasets import fetch_openml mnist = fetch_openml('mnist_784',version=1,cache=True) from tensorflow.keras.utils import to_categorical X = (mnist.data.values/255).reshape(len(mnist.data),28,28,1) y = to_categorical(mnist.target.astype(np.int),10) from sklearn.model_selection import train_test_..
tensorflow, keras 실습: mnist 예제 import tensorflow as tf from tensorflow import keras from sklearn.datasets import fetch_openml from tensorflow.keras.utils import to_categorical mnist = fetch_open('mnist_784', version=1) X = mnist.data y_ori = mnist.target y = to_categorical(y_ori, 10) tensorflow와 keras를 import 하고, sklearn의 datasets에서 fetch_openml을 불러와서 mnist data를 불러온다. X에 mnist.data를, y_ori에 mnist.target을 넣어준다. mnist는 0부터 9까지..
tensorflow, keras 실습: Iris data import tensorflow as tf from tensorflow import keras !pip install tensorflow로 tensorflow를 깔고, 위처럼 import를 해준다. tensorflow로 iris를 분류하는 모델을 만들겠다. from sklearn.datasets import load_iris iris = load_iris() X,y_ori = iris.data, iris.target iris.target으로 받은 y_ori는 0, 1, 2로 구분되어 있다. 0, 1, 2는 명목형 변수로 대소관계가 없기 때문에 이를 one hot encoding으로 만들어주겠다. from tensorflow.keras.utils import to_categorical y = to_cate..
데이터 원본 설정하기: 사용자 지정 분할 태블로에서 '분할'과 '계산된 필드 만들기'를 통해 필드를 분할할 수 있다. 오늘은 분할 방식으로 '스타벅스 구매목록.xlsx' 파일의 필드를 분할 처리 하겠다. 자료 출처: 태블로 굿모닝 굿애프터눈 (1) 데이터 원본 편집 -1) 사용자 지정 분할로 하나의 칼럼을 구분자를 기준으로 여러 칼럼으로 나누기 '스타벅스 구매목록.xlsx' 파일을 열어주니 데이터 원본 페이지에서 구매 번호, 아이템, 원가격, 결재금액, 쿠폰 사용 여부 칼럼을 확인할 수 있다. 아이템 칼럼에서 '-' 구분기호 앞에는 Iced 여부를, ')' 구분기호 앞에는 음료의 사이즈를, 그 뒤에는 음료의 종류를 알려준다. 이 구분기호를 기준으로 사용자 지정 분할을 수행하겠다. 아이템 칼럼의 삼각형 표시>사용자 지정 분할을 선택한다. 먼저, ..
데이터 원본 설정하기: 유니온(Union) 유니온(Union) 비슷한 포맷의 데이터를 Union으로 통합하면 한 테이블의 행을 다른 테이블에 추가하여 좌우가 아닌 상하로 테이블을 결합할 수 있다. (1) 유니온으로 년도 시트 연결하기 '서울날씨_최고기온.xlsx' 파일을 선택하여 파일을 연결하면, 1990년부터 2019년의 월,일간 날씨가 서로 다른 시트로 표시된다. 1990년 시트 아래 1991년부터 2019년 시트까지 유니온 방법으로 연결할 것이다. (i) 시트를 하나씩 붙이기 1990년 시트가 캔버스에 표시된 상태에서, 1991년 시트를 1990년 시트 하단 근처에 '유니온으로 테이블 끌기'가 표시될 때까지 끌어준 후 놓으면, 유니온으로 두 시트가 위아래로 붙여진다. (ii) 여러 시트 한 번에 붙이기 혹은 1990년 시트를 선택한 후 20..
데이터 원본 설정하기: 블렌딩(Blending) 블렌딩(Blending) 블렌딩은 데이터를 좌우로 붙인다는 점에서 조인 연결과 유사해 보인다. 하지만 조인 연결은 데이터를 연결한 후에 집계를 하지만, 블렌딩은 데이터 원본은 별도로 둔 상태에서 시트에서 데이터를 집계 한 다음 결합을 한다는 점에서 다르다. 아래의 상황에서 조인보다 블렌딩이 적합하다. 교차 데이터베이스 조인이 지원되지 않는 경우 데이터의 세부 수준이 다른 경우 데이터가 많은 경우 (조인으로 데이터를 연결하여 집계할 경우 성능에 상당한 영향을 끼칠 수 있기에, 데이터를 집계 후 연결하는 블렌딩이 적합할 수 있다.) 'SUPERSTORE_2019.xlsx' 파일을 선택하여 열어준다. 주문 일자를 열선반에 올리고 매출을 더블클릭하면, 주문 일자(년도) 별 매출 합계가 표시된다. 이제 'SUPE..
데이터 원본 설정하기: 교차 데이터베이스 조인 연결하기 - 달력(오른쪽 조인) 교차 데이터베이스 조인 연결 : 서로 다른 원본 데이터의 조인 연결 (1) 특정 날짜가 누락된 파일에서 캘린더 차트 만들어보기 'SUPERSTORE_201909.xlsx' 파일의 매출 시트를 열겠다. 2019년 9월 한달 동안의 주문 일자와 매출 합계가 총 28개의 행으로 표시되어 있다. 2019년 9월 한달의 캘린더 차트를 만들겠다. 좌측 테이블의 주문 일자를 마우스 우클릭을 한 채 선반에 올리면 올릴 수 있는 필드가 나온다. 열선반에 불연속 년월, 불연속 요일을, 행선반에 불연속 주를 올려서 달력 모양을 만들었다. 주문 일자를 우클릭하여 텍스트 마크에 불연속 일을 올렸다. 해당 데이터 원본에는 매장이 영업하지 않은 8일, 22일의 날짜가 표시되지 않았다. 해당 날짜도 캘린더에 표시하기 위해 임의로 날..
데이터 원본 설정하기: 동일한 데이터베이스 조인으로 반품률 구하기 데이터 연결 방법 조인 연결 방식: 공통된 필드에서 데이터를 옆으로 이어 붙이는 방식, 데이터 연결 후 집계 동일한 데이터베이스 조인: 같은 데이터 원본에 있는 서로 다른 시트를 연결 교차 데이터베이스 조인: 다른 데이터 원본의 시트를 연결 블렌딩 연결 방식: 왼쪽 조인과 유사, 집계 후 데이터 연결 유니온 방식: 데이터를 아래 방향으로 연결 'Superstore KR v2018.xlsx' 파일의 '주문' 시트와 '반품' 시트를 동일한 데이터베이스 조인으로 반품률을 구하겠다. (1) 왼쪽 조인 연결 하기 Superstore KR v2018.xlsx 파일을 열고 '주문' 테이블을 올린다. '주문' 테이블을 더블클릭하여 생기는 칸에 '반품' 테이블을 drag and drop으로 올린다. '주문' 테이블과 '..