[시각화] 2장. 데이터 분석과 시각화
기대운 님이 발표한 내용에 대한 생각입니다.
인식 방법과 표현 방법
과거: 데이터의 크기와 다양성이 문제되지 않았음. -> 데이터를 이해하고 분석하는 것이 간단한 과정이었음.
현재: 엄청나게 많은 데이터가 셀수 없는 영역에서 존재.
대부분의 시각화 시스템은 사람과 컴퓨터가 협력하고 아래 업무들을 수행할 수 있게 구현돼 있다.
데이터 분석 향상을 위해 시각적으로 표현
데이터 이해, 아이디어, 가설, 통찰을 위한 시각적 표현 모델
가설을 보조해주거나 모순되는 증거를 찾기 위해 사용자의 모델을 향상시켜주는 것
아이디어를 공유하고 조직화하기 위해 사용자를 도와주는 것
시각화를 위한 좋은 사례들
-> 최종 목표가 무엇인지를 아는 것 이러한 질문들에 대해 알고, 시각화의 목적에 대해 잘 이해했을 때, 그 다음에 해야 할 것은 좋은 표현을 위한 방법을 선택하는 것!!
일반적으로 사용되는 시각화 방법
- 비교와 순위
- 상호 연관성
- 분포
- 지역 특성 혹은 지리 정보
- 일부와 전체의 관계
- 시간에 따른 경향
비교와 순위
대표적 방법: 막대 그래프(양, 수치를 같은 기준선에서 길이로 부호화)
막대그래프의 한계
ex. 아프리카 상위 12개국의 GDP를 표현
상호연관성
측정된 정보 사이의 연관성을 찾아내는 첫 걸음으로 좋은 방법
ex.산포도
상관행렬도를 시각화 표현
ex.산포도 또는 히트맵
오늘 얘기해 준 내용들은 발표자료에는 이미지도 같이 많이 있었는데,
개인적으로는 솔직히, 실제로 쓴다면 어떤식으로 써야될지 감이 오지 않았다.
이론적인 내용들 위주라 그런거 같은데, 책을 봐야 알수 있는듯하다.