행과 집계의 차이
행 수준 계산식
- 모든 행에 대해 계산 후 결과 값을 집계
- [수익] / [매출]
- 모든 행에 대해 결과 값이 실체화(materialized)되기 때문에 처리 로직 다시 실행할 필요 X
집계 수준 계산식
- 각 필드 값을 집계한 후에 계산
- SUM([수익]) / SUM([매출])
- 뷰에 사용된 차원에 따라 집계 값이 달라지기 때문에 Tableau 데이터 추출에서 실체화(materialized)될 수 없음
위 오류는 행 수준 계산식과 집계 수준 계산식이 혼합되어 사용될 때 나타난다.
(ex. [수익] / SUM([매출]) )
행 수준 계산식 VS 집계 수준 계산식
두 계산된 필드를 생성한 후, 백분율 형태로 지정한다.
수익률을 집계 수준으로 계산한 필드의 경우, 이미 집계된 수익과 매출 값을 사용해 계산을 하기 때문에 제대로 계산이 됨을 알 수 있다.
수익률을 행 수준으로 계산한 필드의 경우, 원본 데이터를 보면 각 행마다의 수익률이 잘 계산 됨을 볼 수 있다.
하지만, 시트에서는 이미 계산된 값들 기준으로 집계를 한 번 더 진행하여 약 20000%라는 큰 값의 수익률로 나타나게 된다.
목표 매출(2억)을 달성한 시도와 아닌 시도 색상 구분
집계된 수준의 계산된 필드를 생성한다.
생성된 필드를 색상을 통해 구분하면, 2억이 넘는 매출에 해당되는 시도는 참, 해당되지 않는 시도는 거짓으로 분류되어 색상이 나타나게 된다.
매출 수준의 행수준으로 같은 작업을 반복해본 결과는 다음과 같다. 모든 시도가 거짓으로 나타나게 되는데, 주문 건당 매출액이 2억 이상이 없다는 것을 의미한다.
매출의 경계값을 2억이 아닌 200만으로 바꾼 결과이다. 실제 매출액이 200만원 이상에 해당하는 주문이 실제 매출액에 얼마만큼의 비율 차지하는 지 파악할 수 있다.
행 수준 계산으로 구하느냐, 집계 수준 계산으로 구하느냐에 따라 다른 결과물을 나타낼 수 있다.
행 수준 계산 사용
- 열과 열의 연산 ( +, -, *, /, %)
- 문자열의 처리
- 형 변환
- 날짜/시간 계산
예시
주문일자가 2019년이면, 행 수준의 매출 값을 가져오도록 하는 조건문이 작성된 필드를 생성한다.
시트에 필드를 올려 확인해 본 결과, 2019년 매출 열에서는 2019년의 매출 합계가 나타남을 알 수 있다.
원본 데이터를 살펴보면, 주문 일자가 2017년인 경우에는 Null로 표시되어 있고, 2019년인 경우 매출 데이터가 들어가 있음을 확인할 수 있다. 이렇게 행 수준으로 가져와진 값은 합계로 다시 한 번 집계가 되어 시트에 나타나게 된다.
2일차 과제
1. 워드 클라우드
워드 클라우드
- 많은 키워드 속에서 분석 목적에 따라 핵심 키워드를 표현하는데 유용한 시각화
- 값의 자세한 비교보다는 데이터의 트렌드를 나타내는데 유용
2. 박스플롯
박스플롯
- 데이터의 분포 상태와 이상치를 동시에 보여주는 시각화
- 서로 다른 데이터 군을 쉽게 비교 가능
3. 계산된 필드 만들기
- 평균 카페인 함유량이 80mg보다 높은 카테고리와 아닌 카테고리를 분류하는 필드 생성
4. 매장 운영 시간
- 운영시간을 나타낼 수 있도록 'DATEDIFF'함수를 사용하여 영업시작시간과 영업종료시간의 차이를 계산하는 필드를 생성
[피드백]
- 위 계산된 필드로 계산 시, 단순히 시간을 기준으로 계산하게 되며 "분"단위 차이가 계산이 되지 않는 한계점 존재
- "분" 단위 계산 후 "시간"으로 재환산 하는 계산식으로 수정
'대외활동 > 태블로 신병훈련소 25기' 카테고리의 다른 글
[태블로 신병훈련소] 6일차 학습 : 고급계산식 (3) | 2024.10.30 |
---|---|
[태블로 신병훈련소] 5일차 학습 : 다양한 맵 활용 (10) | 2024.10.27 |
[태블로 신병훈련소] 4일차 학습 : 테이블 계산식 (0) | 2024.10.26 |
[태블로 신병훈련소] 3일차 학습 : 매개변수, 대시보드 동작 (0) | 2024.10.26 |
[태블로 신병훈련소] 1일차 학습 : 기초 실습 (1) | 2024.10.25 |