히스토그램
히스토그램은 단순 막대 차트가 아니라, 연속형 측정값을 구간 차원을 기준으로 나눈 것이다. 특정 구간 차원에 범주형이 얼마나 분포되어 있는 지를 살펴보는 데 좋고, 이 땐 측정값을 구간 차원으로 만들어줘서 열 선반에 올려주고 그에 대한 차원의 카운트를 행선반에 올려준다.
(1) 필드 만들기
첫번째 제품 구매 후 두번째 제품을 구매하는 데 걸린 시간을 구간 차원을 10일 기준으로 만들어서 어느 구간대에서 재구매가 주로 발생하는 지 파악할 것이다. 이를 위해 고객별로 첫번째 주문 날짜, 두번째 주문 날짜, 두번째 주문과 첫번째 주문의 날짜 차이를 알아야 하고, 두번째 주문 날짜를 알기 위해선 첫번째 주문 날짜를 제외한 날짜, 즉 재주문 날짜를 알아야 한다.
① 고객별 첫 주문 일자
계산된 필드 만들기에서 FIXED 함수는 {} 안에 들어가야 하고, ":"를 기준으로 왼쪽에는 집계하고 싶은 차원, 오른쪽은 왼쪽 차원을 계산하고자 하는 식을 쓴다. {FIXED [고객 이름] : MIN([주문 날짜])} 는 고객 이름별 최소 주문 날짜, 즉 첫 주문 날짜를 계산한다.
② 고객별 재주문 일자
IIF(조건, 조건 만족시 명령, 조건 불만족시 명령)의 구조인데, 주문 날짜가 고객별 첫 주문 일자보다 크면, 즉 고객의 재주문 일자에 대해서만 남겨놓고 나머지는 NULL 처리 하라는 것이다.
③ 고객별 두번째 주문 일자
고객별 첫번째 주문 일자와 같은 맥락으로, 고객 이름 별 최소 재주문 일자, 즉 두번째 주문 날짜를 계산한다.
④ 고객별 고객별 첫 주문 후 두 번째 주문까지 걸린 날짜
DATEDIFF 함수로 첫 주문 일자와 두번째 주문 일자간 날짜 차이를 계산한다.
(2) 구간 차원 설정
④에서 만든 '고객별 첫 주문 후 두 번째 주문까지 걸린 날짜'를 우클릭하여 구간차원 선택, 새 필드명을 정하고 구간차원 크기를 10으로 만들고 연속형으로 설정해준다.
(3) 히스토그램 만들기
'고객별 첫 주문 후 두 번째 주문까지 걸린 날짜'를 열 선반에 올리고, 행 선반엔 고객 이름별 카운트를 올려야 한다. '고객 이름'을 우클릭하여 행선반에 올린 뒤 필드 놓기 창에서 카운트(고유)(고객명)을 선택하면, 재주문까지 걸린 날짜의 구간이 10씩 잘리고, 각 구간에 해당하는 고객들이 카운트가 세진다.
오른쪽 아래 NULL값이 하나가 있다고 표시된다. 첫 번째 주문 후 재주문을 하지 않은 고객들은 두번째 주문까지 걸린 날짜에서 속할 구간이 없기 때문이다. 1NULL을 누르고 '데이터 필터링'을 선택하면 이 NULL값들이 제외되어 시트에서 표시되지 않는다. 반면 '기본 위치에 데이터 표시'는 특정 값(0, 평균 등)으로 NULL값을 대체할 수 있다.
색상, 크기를 변경하여 히스토그램을 만들었다. 첫 구매 후 두 번째 구매까지 20~39일 걸리는 고객이 총 30명으로 가장 많았다는 결론을 내릴 수 있다.
'시각화 > tableau 굿모닝 굿애프터눈' 카테고리의 다른 글
태블로 차트 만들기: 라운드형 막대 차트(Rounded bar chart) 만들기 (0) | 2021.05.07 |
---|---|
태블로 차트 만들기: 이중축(Dual axis), 결합된 축(Combined axis) (0) | 2021.05.07 |
태블로 차트 만들기: 간트 차트 (0) | 2021.04.28 |
태블로 차트 만들기: 누적 막대 차트 (0) | 2021.04.28 |
태블로 차트 만들기: 영역 차트 (0) | 2021.04.27 |