본문 바로가기

시각화/tableau 기초

태블로 기초: 차원과 측정값

vizlab.tistory.com/33

 

[1]-1. 차원과 측정값

지금이 2018년 8월이니까, 태블로를 사용한지 2년 반 정도 되어갑니다 교육도 받고, 혼자 고민도 하고, 구글링도 하고... 그렇게 저렇게 하면서 지금까지 왔고, 누군가에게 내가 익혔던 것들을 - 작

vizlab.tistory.com

위의 블로그를 참고하여 작성했습니다.


 

SKT bigdata hub에서 데이터를 사용하고 싶었지만, 로그인 허가가 되지 않고 이젠 사이트도 안들어가져서 직접 데이터를 볼 순 없었고 블로그 내용을 캡쳐하여 사용했다.

 

측정값

아래는 SKT bigdata hub에서 배달 업종 이용 현황에 관한 데이터이고 이를 이용하겠다.

 

<통화 건수를 수치형으로 바꿔 측정값에 넣기>

측정값은 우리의 관심을 받는 대상 그 자체이다. 이 데이터셋에서 측정값은 '통화 건수'이다. 데이터에서 통화 건수에 해당하는 열이 문자열로 설정되어 있는데 이를 수치형으로 바꿔주겠다. (하지만 측정값이 항상 숫자일 필요는 없다.)

 

(1) 데이터를 불러들이는 단계에서 해결

Abc라고 된 곳을 눌러서 데이터를 문자열이 아닌 숫자형으로 변경한다.

(2) 시트로 넘어간 후 해결

시트 안에서 차원에 들어있던 통화건수를 측정값으로 drag and drop으로 끌어낸다. 필드명 앞의 'Abc'를 숫자(정수)로 바꿔줄 수 있다.

 

 

+) 레코드 수

레코드 수는 기본적으로 제공되는 측정값이고 이는 데이터의 행의 개수이다. 행선반에 레코드 수를 올려 놓고 바 위에 마우스를 갖다 대서 수를 확인한다.

 

+) 초록색 알약과 파란색 알약

대부분의 경우에서 측정값은 초록색 알약으로, 차원은 파란색 알약으로 표현되는데, 항상 그런 것은 아니고 연속형이 초록색 알약에, 불연속형이 파란색 알약에 해당한다.

 

차원

차원은 우리가 관심을 가지는 측정값을 어떻게 썰어서 볼 것인가, 즉 관점을 의미한다. 측정값을 어떤 기준에 따라 파악할 것인지에 대한 것이다. 

위에서 차원에 해당하는 변수들(시간대, 시군구, 시도, 업종, 요일, 읍면동, 일자 등)로 측정값인 통화 건수를 파악할 것이다. 

 

 

(1) 사람들은 어떤 음식을 많이 시켜 먹을까?

: 업종을 차원으로, 통화 건수를 측정값으로 두어 통화 건수를 업종으로 썰어본다. 

열선반에 업종이, 행선반에 통화 건수가 들어가고 중국 음식을 가장 많이 시켜먹는 것을 알 수 있다. 

 

 

(2) 어떤 시간대에 어떤 음식을 많이 시켜 먹을까?

: 시간대를 차원으로, 통화 건수를 측정값으로 두고 통화 건수를 시간대로 썰어본다.

행선반에 통화 건수가, 열선반에 시간대가 들어가고 업종을 마크의 색상에 넣는다. 저녁 시간대에 음식을 많이 시켜먹고 치킨을 가장 많이 시켜 먹는다.

 

 

(3) 어떤 요일에 어떤 음식을 많이 시켜 먹을까?

요일을 차원으로, 통화 건수를 측정값으로 두고 통화 건수를 요일로 썰어본다.

열선반에 요일을, 행선반에 통화 건수를 두고 업종을 마크의 색상에 넣는다. 

주말에, 중국음식과 치킨을 가장 많이 시켜먹는 것으로 확인된다.