오랑우탄의 반란

데이터 전처리 & 시각화 (6) 데이터 시각화란? 본문

PYTHON/데이터분석

데이터 전처리 & 시각화 (6) 데이터 시각화란?

5&2 2024. 7. 18. 01:00
반응형

 

오늘 오랑이는 matplotlib을 활용한 데이터 시각화에 대해 배울 예정입니다. 

image source: https://thenewstack.io/7-best-practices-for-data-visualization/

 

그동안 데이터 전처리를 위해 사용하는 pandas의 개념을 익혔는데요, matplotlib으로 시각화를 해보기 전에 데이터 시각화에 대해 간단하게 짚고 넘어가겠습니다.

 

 

데이터 시각화

WHAT 데이터 시각화란? 

→ 데이터 시각화란 말 그대로 정리된 데이터를 더 효과적으로 보기 위해 정보와 시각적인 요소를 패밍한 것입니다. 

그래프, 지도, 시뮬레이션 등 그래픽 요소로 변환된 정보 모두 데이터 시각화의 예시입니다.

 

 

WHY 데이터 시각화가 왜 필요하나요?

복잡한 다량의 정보를 가장 직관적이고 효과적으로 전달하기 위한 수단이기 때문입니다. 

텍스트에 비해 그래픽에 대한 정보 처리 속도가 가장 빠르며, 다량의 정보를 담으면서도 중요한 부분에 이목을 집중시킬 수 있는 것이 데이터 시각화의 최대 장점입니다.

  1. 패턴 발견 및 이해
    데이터 내의 숨겨진 패턴을 발견하고 이해하는 데에 도움을 줍니다.
    1. 시간에 따른 매출 추이: 계절적 변동, 특정 시기
    2. 지역별 매출
    3. 제품 카테고리별 매출
    4. 고객 구매 패턴: 히스토그램이나 box plot 으로 시각화해 평균 구매액, 최고/최저 구매액, 이상치 데이터 등 파악해 구매 습관이나 행동 이해 가능
  2. 의사 결정 지원
    복잡한 데이터에 대해서 정보를 명확하게 전달할 수 있습니다. 
    1. 마케팅 캠페인 효과 분석: 선 그래프로 시간에 따른 매출 또는 고객 유입량의 변화를 추적해 캠페인 효과 파악 가능, 실제 매출과 고객 유입에 어느 정도 효과 있는지 판별 가능
    2. 캠페인 채널별 효과 비교: 막대그래프, 원형차트로 채널별 매출이나 고객 획득량 비교 가능
    3. 고객 반응 분석: 히스토그램, 상자 그림으로 캠페인에 참여한 고객들의 평균 구매액 증가, 반응 시간 변화 등의 반응 분석 가능
    4. A/B 테스트 결과 시각화: 버전별 마케팅 캠페인이나 웹페이지의 변화가 고객에게 미치는 영향 파악 가능 
  3. 효과적인 커뮤니케이션
    데이터에 대한 분석을 공유하고 다른 사람을 설득할 때 빠르고 쉽게 이해시킬 수 있어 용이합니다. 
    1. 보고서와 PT
    2. 의사 결정자와의 논의
    3. 다양한 대중에게의 정보 전달
    4. SNS 및 인터넷 활용
    5. 간결하고 효과적인 커뮤니케이션 

 

HOW 데이터 시각화를 어떻게 해야 하나요?

정보와의 적절한 매핑이 중요하며 전달하고자 하는 바가 잘 표현됐는지, 왜곡이 없는지 확인해야 합니다. 

모든 정보에 대해 시각화하는 것은 효과적이지 않을 수 있습니다. 

 

 

 

다음 글에서는 데이터 시각화를 하기 위한 툴 Matplotlib 에 대해서 본격적으로 알아보겠습니다. 

 

 

 

오랑우탄이 영어를 하고 오랑이가 코드마스터가 되는 그날까지~

 

 

반응형