데브코스 미니 텀 프로젝트를 진행하며 분석파트를 맡게 되었다.
저번에는 데이터 수집단에서 주로 활동을 했어서, 이번엔 데이터를 직접 분석해보고 시각화해보고 싶은 마음에 선택하게 되었다.
시각화 툴로는 이전 실습때 사용했던 Superset을 사용하게 되었는데, 분석 데이터에 맞는 시각화 차트를 선택하기 위해 chart 종류와 사용 사례를 알아보고 정리해보았다.
시각화 chart 종류 요약 (Superset)
Chart Name | 요약 | 사용하는 경우 | 예시 |
Area Chart | 개별값이 아닌 전체 추세를 보여주는 용도. | • 데이터 총계가 있고, 비교할 기간이 있을 경우 • 차트 요점은 개별 값이 아닌 전체 추세 전달함 • 부분 대 전체 관계를 갖는 여러 데이터 열 또는 누적 값 열이 있음 |
특정 제품을 구입한 연령대 별 그리고 지역별 판매정도 |
Bar Chart (legacy) | 범주형 데이터 비율 표시 | ||
Big Number | KPI 등 강조할 수치 표현 | 중요 집계 값 혹은 KPI | |
Funnel Chart | 전환율 측정 시 유리함 | 리크루팅 과정 별 통과 인원수 | |
Gauge Chart | 도넛형 차트와 포인터를 이용하여 값의 현재 위치 나타냄 | • 한 가지만 측정 가능 • 선형 데이터이어야함 | 전체 작업량 대비 완료된 작업 |
Graph Chart | 카테고리(노드) 사이를 선으로 연결한 그래프 | ||
Line Chart | 시간에 따른 변화 보여주는데 탁월한 유형 | 정의된 기간 또는 연속된 기간 동안 하나 이상의 변수를 추적하는 데 이상적임 | 시간에 따른 고객의 소셜 미디어 순위 추적 |
Mixed Chart | 서로 다른 두 차트를 x축을 공유하며 차트를 혼합한 형태 | DAU 지수(total member와 daily member) | |
Pie Chart | 원으로 전체 비율 표현하는 차트 | 데이터가 고유하며 시간관련 필드 없이 소규모인 경우 | 판매 카테고리 차트 |
Pivot Table | 하나 이상의 개별 범주 내에서 보다 광범위한 테이블의 개별 항목을 집계하는 그룹화된 값의 테이블 | • 집계함수 사용하는 경우 • group화 • 필터링 위 작업들 사용 가능 |
넷플릭스 시청률 국가별, 및 tv쇼/영화별 그룹화 |
Radar Chart | 3개 이상의 그룹/범주별로 병렬 메트릭 세트를 시각화 | • 특이치를 식별해야되는 경우 • 범주형 데이터 | 직원들을 위한 스킬 분석 |
Sankey Diagram | 소스에서 대상까지의 흐름 라인 크기를 기반으로 메트릭 데이터의 상대적 크기를 전달하는 일반적인 흐름도 | 흐름이 있는 설문 조사 답변 그래프화 | |
Scatter Plot | 점으로 메트릭이 차원(예: 시간)에 따라 어떻게 변화하는지 시각 | (두 변수 사이의 관계)연속형 값의 경우 시간에 따른 변화를 보여주는 데 탁월 | 이상 징후 식별 |
Smooth Line Plot | 특히 연속형 값의 경우 시간 경과에 따른 변화를 보여주는 데 탁월 | 월별 자전거 유형 사용빈도수 | |
Stepped Line Chart | 특히 연속형 값의 경우 시간 경과에 따른 변화를 보여주는 데 탁월 | 월별 자전거 타는빈도수 | |
Table Chart | 일반 표 유형 | ||
Tree Chart | 계층 구조 시각화에 좋음 | ||
Treemap | 여러 그룹의 동일한 메트릭을 시각화함 | "부분 대 전체" 비율을 포함하여 여러 요소를 한 번에 정확하게 표시함 | 특정 기간 동안 특정 지리적 지역에 속하는 지역 내 문맹퇴치율 |
차트 별 상세 설명
Area chart
시간 흐름에 따른 비율(%) 변화 시각화 용도 (전체 추세)
https://docs.preset.io/docs/area-chart
https://www.tibco.com/reference-center/what-is-an-area-chart
사용하는 경우
- 데이터 총계가 있고, 비교할 기간이 있을 경우
- 차트 요점은 개별 값이 아닌 전체 추세 전달함
- 부분 대 전체 관계를 갖는 여러 데이터 열 또는 누적 값 열이 있음
예시
특정 제품을 구입한 연령대 별 그리고 지역별 판매정도
Bar chart (legacy)
범주형 데이터 시각화
그룹 및 하위 집합 별로 비율을 비교하기 위함
https://docs.preset.io/v1/docs/bar-chart
https://www.tibco.com/reference-center/what-is-a-bar-chart
사용하는 경우
- 단순한 시각적 형태로 요약할 수 있는 대규모 데이터 세트
- 서로 다른 카테고리
- 비교를 위한 고정된 값 집합(예: "상위 10개")
- 한 눈에 보기 쉬운 데이터 추세
상세 종류 중 스택 차트
https://www.tibco.com/ko/reference-center/what-is-a-stacked-chart
세로막대형 차트를 사용하지 않을 때
- 범주 수가 많거나, 누적 값이 필요하거나, 값이 작거나, 값이 비율인 경우에는 세로막대형 차트를 피하고 대체 차트를 찾음
- 비교할 범주가 많은 경우 선 그래프를 사용하는 것이 좋음
Big Number & Big Number with Trendline Charts
중요 집계 값 혹은 KPI를 강조함
큰 숫자차트로 최근 상태 강조 및 추세선을 표현 가능
https://docs.preset.io/v1/docs/big-number-chart
Funnel Chart
영업, 마케팅, 제품 및 운영 팀에서 전환율 측정할 때 많이 사용하는 차트
단계별로 지표가 변화하는 것을 표현하기 위한 목적
https://docs.preset.io/v1/docs/funnel-chart
https://www.tibco.com/ko/reference-center/what-is-a-funnel-chart
사용하는 경우
- 데이터는 3개 이상의 일련의 단계를 거친다.
- 데이터는 각 단계에서 감소함. 즉 첫 번째 단계에는 두 번째 단계보다 항목이 더 많고, 두 번째 단계에는 세 번째 단계보다 항목이 더 많음
- 데이터는 수이며 모든 단계에서 데이터는 명확하게 감소함
예시
- 고객 이탈 시각화
- 선택 프로세스 시각화 (인터뷰나 경쟁 같은 프로세스)
Gauge Chart
도넛형 차트와 포인터를 이용하여 값의 현재 위치 나타냄
최종 값과 현재 값이 있는 형태
https://docs.preset.io/v1/docs/gauge-chart-1
https://www.tibco.com/ko/reference-center/what-is-a-gauge-chart
사용하는 경우
- 한 가지만 측정 가능
- 긴급한 이유가 없는 한 0에서 시작해야 함
- 선형이어야 함
- 단일 성취 비율을 표시해야 함
예시
- 전체 작업량 대비 완료된 작업
- 판매 완료 대 판매 목표
- 예산 목표 대 이익
- 프로젝트 관리에서 마감일 및 모듈 정의
- 경제 및 금융 분야에서 조사한 내용과 통계 표시
- 측정 가능한 핵심 성과 지표에 대한 팀의 성과
- 학계, 분석, HR, 의료 분야에서 핵심 지표 표시
Graph Chart
카테고리(노드) 사이를 선으로 연결한 그래프
https://docs.preset.io/v1/docs/graph-chart-1
Line chart
시간에 따른 변화 보여주는데 탁월한 유형
.https://www.tibco.com/reference-center/what-is-a-line-chart
https://docs.preset.io/v1/docs/line-chart
사용하는 경우
대체로 다 유용함
- 정의된 기간 또는 연속된 기간 동안 하나 이상의 변수를 추적하는 데 이상적임
예시
- 시간이 지남에 따라 고객의 소셜 미디어 순위를 추적
- 주식과 다른 금융적 이익의 상태를 추적
- 다양한 질병의 유행 추세
Mixed Chart
서로 다른 두 차트를 x축을 공유하며 차트를 혼합한 형태
https://docs.preset.io/v1/docs/mixed-time-series-chart
예시
- DAU 지수
- total member와 daily member
Pie Chart
원으로 전체 비율 표현하는 차트
https://docs.preset.io/v1/docs/piechart
https://www.tibco.com/reference-center/what-is-a-pie-chart
사용하는 경우
- 데이터가 고유하게구성된 경우 원형 차트가 데이터를 나타내는 데 가장 적합
- 시간을 나타낼 필요 없는 경우
- 데이터 구성이 소수일 경우
- 시각화 간편화
- 각 범주가 표본 데이터에 얼마나 기여하는지를 시각화하는 데 가장 좋음
예시
- 판매 카테고리 차트
Pivot Table
하나 이상의 개별 범주 내에서 보다 광범위한 테이블의 개별 항목을 집계하는 그룹화된 값의 테이블
https://docs.preset.io/v1/docs/pivot-table
사용하는 경우
- 데이터 요약 : 합계, 평균, 최소,최대 값 등의 집계함수를 이용한 통계 정보
- 데이터 그룹화: ex. 지역, 나이대, 성별 기준으로 그룹화 후 특성 분성
- 데이터 필터링 : ex. 날짜 범위, 제품 카테고리, 지역별 필터링
- 데이터 시각화 : 막대,원, 선 그래프 시각화 가능
예시
- 넷플릭스 시청률 국가별, 및 tv쇼/영화별 그룹화
Radar chart
3개 이상의 그룹/범주별로 병렬 메트릭 세트를 시각화
https://docs.preset.io/v1/docs/radar-chart-1
https://www.tibco.com/reference-center/what-is-a-radar-chart
사용하는 경우
- 다변량 관측치 있는 경우
- 변수 여러개
- 특이치를 식별해야되는 경우
- 제품 또는 서비스 간 비교
- 데이터 세트의 크기가 작거나 중간 정도
예시
- 제품, 서비스 또는 기타 관심 항목에 대한 유사성, 차이점 및 특이치를 한 눈에 볼 수 있음
- 직원들을 위한 스킬 분석
- 의사소통, 문제 해결, 팀워크, 마감 시간을 맞추는 능력, 시간 엄수 및 기술적 이해의 측면
Sankey Diagram
소스에서 대상까지의 흐름 라인 크기를 기반으로 메트릭 데이터의 상대적 크기를 전달하는 일반적인 흐름도
https://docs.preset.io/v1/docs/sankey-diagram
사용하는 경우
- 데이터에 흐름이 있는 경우
예시
- 위에 그래프 처럼 설문 조사 답변 그래프화
Scatter plot
(두 변수 사이의 관계)연속형 값의 경우 시간에 따른 변화를 보여주는 데 탁월
https://docs.preset.io/v1/docs/time-series-scatter-plot
https://www.tibco.com/reference-center/what-is-a-scatter-chart
사용하는 경우
- 이상 징후 식별
- 한 변수가 다른 변수에 미치는 영향 확인
- 상관 관계, 패턴, 추세 또는 관계를 확인하는 방법
Smooth Line Chart
특히 연속형 값의 경우 시간 경과에 따른 변화를 보여주는 데 탁월
https://docs.preset.io/v1/docs/time-series-smooth-line-chart
사용하는 경우
연속형 값
예시
- 월별 자전거 유형 사용빈도수
Table Chart
일반 표 유형
https://docs.preset.io/v1/docs/table-chart
Tree Chart
계층 구조 시각화에 좋음
https://docs.preset.io/v1/docs/tree-chart
예시
조직 구성도/흐름도
Tree Map
여러 그룹의 동일한 메트릭을 시각화함
https://docs.preset.io/v1/docs/tree-map
https://www.tibco.com/reference-center/what-is-a-treemap-chart
- 한 눈에 읽을 수 있는 분기와 하위 분기가 있음
- 많은 양의 원시 데이터 시각적으로읽기 쉬운 방식으로 묘사하여 사용자가 패턴을 식별하고 신속하게 비교할 수 있도록 함
사용하는 경우
- 하위 범주뿐만 아니라 주요 범주의 크기를 동시에 표시할 때 매우 유용
- 복잡한 데이터 집합에 걸쳐 부분 대 전체의 관계를 정확하게 전달
- "부분 대 전체" 비율을 포함하여 여러 요소를 한 번에 정확하게 표시함
예시
- 특정 기간 동안 다른 브랜드 또는 모델의 판매 번호를 비교
- 특정 기간 동안 특정 지리적 지역에 속하는 지역 내 문맹퇴치율
- 인구 상위 10개국의 상대적 인구 밀도
- 여러 도시의 전자 제품 판매를 참조하는 데이터
사진 및 내용 출처 :
'#️⃣ Data Engineering > BI,DashBoard' 카테고리의 다른 글
Superset에서 Redshift테이블을 시각화하기(KPI 대시보드) (0) | 2023.05.26 |
---|---|
Superset이란? + Docker로 설치하기 (0) | 2023.05.26 |
시각화 툴과 종류 알아보기 (0) | 2023.05.26 |