들어가며
오늘은 시각화 툴에 대해 학습했다.
시각화 툴 그리고 대시보드, BI 툴은 모두 같은 말로, 주로 KPI등 데이터 기반으로 계산/분석/표시해주는 툴을 의미한다.
이전에 시각화 툴로는 Tableau 만 이름을 듣고 아는 정도 였는데,
Looker, Superset 등 다양한 시각화 툴들의 각각의 특징을 알아볼 수 있었다.
이 다음엔 AWS Redshift의 데이터를 가져와서 Superset으로 시각화해보는 실습을 정리할 예정이다.
본론으로 들어가 시각화 툴과 종류를 알아보자.
시각화 툴과 종류
1. 시각화 툴이란?
(시각화 = 대시보드 = BI) 툴
KPI 지표 등 데이터 기반으로 계산/분석/표시해주는 툴
- 이는 Data-driven Decision, Data-Informed Decision 가능하게 함
- Citizen-Data Analyst가 쉽게 분석할 수 있도록 함
- 데이터웨어하우스에서 주로 ELT를 가지고 작업된 것을 가지고 시각화함
- EDA(Exploratory Data Analysis)에 맞춰진 것들도 있음
2. 툴 종류는 ?
Excel, Google Spreadsheet (가장많이 씀)
Python (R) (EDA에 적합)
Looker
Tableau
Power BI
Apache Superset
Mode Analytics, ReDash
Google Studio
AWS Quicksight
3. 툴 종류별로 알아보기
(1) Looker
2012년 시작했고 구글이 2019년 6월에 인수하여 지금은 구글 클라우드의 일부이다.
- self-service 가장 편함
- 한 번 대시보드 만들어놓으면 수정하기 편함
(2) Tableau
2002년 시작했고 세일즈포스가 2019년 6월 인수함
- 오래되어 다양한 제품군 보유. 일부 무료임
- 극히 전문 인력만 Tableau를 만들 수 있음 (Looker에 비해 다소어려움). 그러나 강력한 대시보드를 작성 가능함
(3) ReDash
오픈소스로 시작했고, 2020년에 Databrick이 인수함
- Superset과 상당히 흡사
- Superset은 사용자 권한 기능이 강력하며 Role 기반으로 대시보드 권한 설정 가능함
- SQL 쿼리 에디터를 제공하지만 사용자 권한 관련 기능은 부족함
(4) Mode Analytics
2013년에 창업됨
- 조금 더 기술적인 사람에게 적합한 대시보드임
- SQL, R, Python 기반으로 데이터 분석 가능함
- KPI대시보다는 EDA 툴에 가까움
(5) Superset
Airbnb에서 시각된 오픈소스로, Airflow를 만든 Maxim이 같이 시작한 오픈소스
- 깃허브 (https://github.com/apache/superset) 있음
- 상용화 서비스 시작됨
- Maxim이 직접 창업했으며 https://preset.io 가서 계정 생성 후 실습 가능함
4. 어떤 시각화 툴을 선택하는 것이 좋은가?
최근 Looker/Tableau가 많이 사용되는 추세이다
- 둘 다 처음 배우는데 시간이 필요함
- Tableau는 가격이 더 싸고 무료버전 존재하여 공부용으로 좋음
중요한 포인트는 셀프서비스 대시보드를 만드는 것이다.
즉, 비전문인력이 다루기 쉬운 형태가 좋다.
그 점에선 Looker가 좋지만 가격이 상당히 비싸다.
시각화 툴 5개를 중점적으로 알아봤다.
최근 트랜드에 따르면 Looker와 Tableau가 Top2 인것으로 보이며, 실제로도 실리콘벨리 주요 회사들은 이를 사용중이라고 한다.
다음장에서는 오픈소스인 Superset에 대해 더 자세히 알아보고, docker로 다운로드 및 실습한 내용을 포스팅하겠다.
'#️⃣ Data Engineering > BI,DashBoard' 카테고리의 다른 글
Superset의 시각화 Chart 종류 (0) | 2023.05.30 |
---|---|
Superset에서 Redshift테이블을 시각화하기(KPI 대시보드) (0) | 2023.05.26 |
Superset이란? + Docker로 설치하기 (0) | 2023.05.26 |