PM 트랙_강의/데이터 드리븐 기획
데이터 드리븐 기획 심화 (2) - 데이터 시각화
은하_carol
2025. 3. 12. 10:52
1. 데이터 시각화 목적
[커뮤니케이션]
- 데이터 시각화는 단순히 데이터를 보여 주는 것이 아니라, 데이터를 기반으로 의미 있는 메시지를 전달하는 것
- 데이터를 명확하고 직관적으로 전달하는 과정으로, 목적에 맞는 시각화 방법을 선택하는 것이 가장 중요
- 복잡한 데이터를 쉽게 전달: 숫자나 텍스트보다 시각적 자료가 직관적으로 정보 전달
- 데이터 기반 의사결정을 촉진: 데이터에 대한 신뢰도를 높이고 논리적인 결론 도출
- 이해 관계자 설득: 경영진, 투자자, 팀원 등 다양한 청중에게 의사결정 유도
2. 데이터 시각화 유형
- 시계열 비교: 시간에 따른 데이터 변화를 분석하는 방법
- 꺾은선 그래프: 기본
- 예) 기업의 연간 매출 데이터
1년 동안의 일별 평균 기온 변화 분석
- 예) 기업의 연간 매출 데이터
- 영역 차트: 변화량을 강조하여 시각적 효과 극대화
- 막대 그래프: 특정 기간별(연도별, 월별) 데이터 비교
- 예) 웹사이트 월별 방문자 수 변화
- 꺾은선 그래프: 기본
- 속성 비교: 여러 그룹이나 범주(카테고리) 간 차이를 분석하는 방법으로, 서로 다른 항목들이 어떻게 다르고, 어느 것이 더 크거나 작은지 비교
- 막대 그래프: 기본
- 예) A, B, C 브랜드의 매출 비교
- 파이(원) 차트: 전체 중에서 특정 항목이 차지하는 비율 확인
- 예) 서울, 부산, 대구에서 하루 동안 판매된 커피 수량 비교
- 히트맵: 여러 범주의 데이터를 색상으로 표현하여 비교
- 예) 고객 만족도를 1점~5점으로 나눠, 각 점수를 받은 고객 수 비교
- 막대 그래프: 기본
- 분포 파악: 어떤 형태로 퍼져 있는지(분포 특성) 분석하는 방법으로, 데이터의 중심값, 범위, 이상값(Outliers) 등 확인
- 산점도: 기본
- 히스토그램: 연속형 데이터의 빈도를 분석하는 데 유용
- 예) 시험 점수 분포를 분석하여 특정 점수대에 학생들이 얼마나 분포하는지 확인
- 상관 분석: 두 개 이상의 변수 간의 관계를 파악하는 방법으로, 한 변수가 증가할 때 다른 변수가 증가하거나 감소하는지 분석
- 산점도: 두 변수 간의 관계를 시각적으로 분석
- 예) 광고비와 매출 간 관계 분석 시 광고비가 증가할 때 매출도 증가하는지 확인
키와 몸무게 간의 상관관계 확인
- 예) 광고비와 매출 간 관계 분석 시 광고비가 증가할 때 매출도 증가하는지 확인
- 산점도: 두 변수 간의 관계를 시각적으로 분석
3. 데이터 시각화 기본
- 배치 순서에 의미를 두어야 함
- 데이터를 배치할 때는 특정한 의미(시간 흐름, 크기 순서 등)를 고려하고 논리적인 흐름을 유지하는 것이 중요
- 시간 순서: 날짜, 연도별 데이터는 반드시 시간순으로 정렬
- 크기 비교: 큰 값 → 작은 값 순으로 정렬하여 가독성 증가
- 예) 시간의 흐름을 나타내는 경우: 연도별 매출 변화 → 연도 순으로 배치 (2020 → 2021 → 2022)
크기를 비교하는 경우: 기업별 매출 순위 → 가장 큰 값부터 내림차순 정렬 (1위 → 2위 → 3위)
- 데이터를 배치할 때는 특정한 의미(시간 흐름, 크기 순서 등)를 고려하고 논리적인 흐름을 유지하는 것이 중요
- 비교 대상에 따라 적절하게 그래프나 표를 조절, 정렬
- 비교하려는 대상에 따라 막대 그래프, 선 그래프, 원 그래프, 표 등 적절히 선택
- 시간 변화: 선 그래프 (2020년 ~ 2023년 매출 변화)
- 크기 비교: 막대 그래프 (기업별 매출 비교)
- 비율 비교: 원형 그래프 (제품별 시장 점유율)
- 정확한 데이터 표시: 표 (제품별 가격 비교)
- 데이터의 특성에 맞게 정렬(내림차순, 오름차순 등)하여 비교하기 쉽게 작성
- 예) 막대 그래프 (Bar Chart): 숫자 크기 비교 (매출, 방문자 수 등 크기 비교할 때 효과적)
선 그래프 (Line Chart): 시간 흐름 분석 (주가, 트래픽 변화처럼 시간에 따른 변화 표현)
원형 그래프 (Pie Chart): 전체 비율 비교 (시장 점유율, 고객 비율 등 비율을 나타낼 때만 사용)
표 (Table): 범주형 데이터 정렬 (수치형 데이터가 아니라 이름, 코드 등 정렬이 필요한 경우)
- 비교하려는 대상에 따라 막대 그래프, 선 그래프, 원 그래프, 표 등 적절히 선택
- 수치를 비교할 때는 가로보다 세로로 표현
- 막대 그래프를 사용할 때 가로형보다는 세로형 추천
- 사람의 시각적 인식 특성상 세로형 그래프가 수치 비교에 더 적합
- 가로형 그래프는 긴 텍스트가 있을 때만 사용하는 것이 효과적
- 기업 이름이 너무 길거나 설문조사 결과처럼 응답이 긴 경우
- 데이터 변화(추세)를 보일 때는 선 그래프 활용
4. 데이터 시각화 주의할 점
- 색은 강조하고 싶은 요소에만 사용
- 색은 최소한의 수로만 사용
- 대비되는 색 사용이나 그라데이션 사용 주의
- 색이 가지고 있는 컬러값들 반영 (+/- 등 표현 시 고려)
- 일반적으로 사용되는 색상
- 주가 그래프: 상승-빨강, 하락-파랑
- 매출 데이터: 목표 달성-파랑, 목표 미달-회색
- 일반적으로 사용되는 색상
- 배경색 사용 시 유의 (무의미한 배경색 지양)
- 불필요한 장식, 테두리 설정 등 지양