본문 바로가기

시각화/tableau 기초

태블로 기초: 차원과 측정값, 그리고 불연속형과 연속형

차원은 불연속형이고, 측정값은 연속형인가?

항상 차원이 불연속형이고, 측정값이 연속형인 것은 아니다. 차원, 측정값에 연속형과 불연속형 모두 있을 수 있다.

측정값: 관심 대상이 되는 것

차원: 측정값을 어떤 관점으로 볼 것인지에 대한 기준

<연속형 차원>

연속형 차원을 생각하기에 앞서 불연속형인 quantity를 열선반에 올려서 차원으로 볼 수 있다. 불연속형 quantity를 열선반에, sales를 행선반에 놓으면 sales(측정값)을 quantity(불연속형 차원)으로 보게 된다.

  • 자동으로 bar 차트가 그려지고,
  • 차트 위쪽에 quantity 레이블이 생기고,
  • 아래쪽의 quantity의 불연속적 변수값인 1~14가 각각의 레이블로 표시된다.

 

이제 연속형 quantity를 열선반에, sales를 행선반에 올려놓겠다. 여기선 sales(측정값)를 quantity(연속형 차원)으로 보는것이다.

  • 여기선 자동으로 라인 차트가 그려지고
  • 차트 아래쪽에 quantity 축 제목,
  • quantity의 변수값인 1~15가 눈금으로 표시된다.

=> 두 차트가 말하는 바가 크게 달라지지 않고, 비슷한 모양을 가진다.

 

<불연속형 측정값>

테이블에서 연속형 변수인 profit을 우클릭>만들기>계산된 필드로, profit의 총 합이 10000보다 크면 'profitable', 그렇지 않으면 'unprofitable'인 profitability 변수를 새로 만들어 주었다. 

이 변수는 테이블의 측정값에 위치해있고, 필드로 drag and drop으로 보내려고 해도 보내지지 않는다.

즉 이 변수를 차원이 아닌 측정값이라고 판단할 수 있는 이유는 다음과 같다. 

 

1) 집계된 측정값에 상응하는 문자열이다. 

'profitable'은 sum(profit)에 상응하는 문자열으로 본질이 sum(profit)이지, 모든 변수값이 'profitable'이라는 문자열로 이루어졌다고 할 순 없다.

 

2) 차원에 의해 분기할 수 있는 값이다.

profit을 category(차원)로, 또는 이를 다시 subcategory(차원)로 분기하고 profitability를 체크했을 때 profitability는 계속 변한다. 즉, profitability는 Level of Detail에 따라 변하는 값이다. 이렇게 LOD에 따라 특징이 변하는 것은 차원이 아닌 측정값이다. 

반면 profitability-raw level은 profit의 sum에 따라 profitable/unprofitable을 나누지 않고 profit의 각 관측치의 profitability를 하나 하나 따진 변수이고 각 변수값이 문자열이기 때문에 '차원'에 들어갔다. 또한, raw data level에서 정의되었기 때문에 차원에 의해 분기될 수도 없다.