인포그래픽 크리에이터인 Ryan McCready에 따르면, 데이터 시각화로 독자를 기만하는 5가지 방법으로 아래와 같은 방법이 있습니다.
이런 일은 언론에서 많이 일어나지만, 논문에서도 종종 확인되는 현상이기도 합니다.
https://venngage.com/blog/misleading-graphs/
그림은 제가 새롭게 그려서 작성해봤습니다.
(1) 세로축에서 베이스라인을 생략하기
- 세로축을 베이스라인 (이 경우에는 0)이 아닌 다른 숫자로 시작할 경우, 같은 데이터로도 전혀 다른 메시지를 전달할 수 있습니다.
- 위의 그림에서는 같은 데이터를 쓰는데 왼쪽은 세로축을 50.0으로 시작하고, 오른쪽은 0으로 시작합니다.
- 왼쪽을 보면 Group A, B, C의 차이가 커보이지만 오른쪽을 보면 큰 차이가 없습니다.
(2) 세로축의 간격 바꾸기
- 세로축의 간격을 조절함으로써 작은 변화를 크게, 또는 큰 변화를 작게 보이게 할 수 있습니다.
- 위의 그림에서는 왼쪽에서는 10 단위로 끊어서 0-40으로 보이고, 오른쪽에서는 5 단위로 끊어서 0-15로 보입니다.
- 왼쪽을 보면 큰 변화가 없어 보이지만, 오른쪽을 보면 변화가 있어 보입니다.
(3) 의도에 맞는 데이터 골라 사용하기
- 의도에 맞는 데이터만 골라서 사용하면 전반적인 추세와는 전혀 다른 정보를 전달할 수 있습니다.
- 왼쪽에서는 2020년 5월-8월까지의 데이터를, 오른쪽에서는 2019-2023년 데이터를 보여주고 있습니다.
- 왼쪽만 보면 전체적으로 상승하는 느낌이지만, 오른쪽을 보면 전체적으로 올랐다가 떨어지는 것을 알 수 있습니다.
(4) 잘못된 유형의 그래프 사용하기
- 시각화하고자 하는 자료의 유형에 맞지 않는 그래프를 사용하면 정보가 왜곡될 수 있습니다.
- 왼쪽에서는 파이형 차트를 사용하고 있고, 오른쪽에서는 막대형 차트를 보여주고 있습니다.
- 총합이 100%인 경우에는 왼쪽처럼 파이형 차트를 쓰는 게 맞지만, 그렇지 않고 비교할 경우에는 오른쪽처럼 막대형 차트를 쓰는게 맞습니다.
(5) 시각화의 관례에 역행하기
- 시각화에는 관례가 있습니다. 예를 들어 밀도가 낮으면 옅게, 높으면 짙게 시각화하는 방식이 있습니다. 이러한 관례를 따르지 않으면 독자들이 오해하기 쉽습니다.
- 왼쪽에서는 숫자가 증가할수록 옅어지게, 오른쪽에서는 숫자가 증가할수록 짙어지게 표현했는데 오른쪽 방식이 적합합니다.