티스토리 뷰

생활/책

[책] 데이터 분석가의 숫자유감

Jaeyeon Baek 2022. 9. 2. 23:42

데이터 분석가의 숫자유감

 

데이터 문해력을 키워주는 작지만 강력한 책을 만났습니다. 데이터 분석가가 들려주는 데이터 이야기인 "데이터 분석가의 숫자유감"입니다. 기본적인 구성은 만화로 되어 있고 각 화가 끝날 때마다 3~4 페이지 분량의 텍스트로 만화 컷에서 다룬 내용을 정리해줍니다.

총 14화로 구성되어 있는데요. 책 읽는 속도가 느린 편인 저도 한 시간이 안 걸려서 뚝딱 읽을 수 있었습니다(페이지 번호가 표시된 마지막 장이 342p). 사실 책에 84% 정도가 만화로 구성되어 있기 때문에 당연한 결과지요. 84%라는 수치는 342p 중에 1화가 끝날 때마다 대충 4페이지 정도 텍스트가 있으니 총 14화이므로 56p가 텍스트라는 이야기. 그렇다면 전체 중에 텍스트는 56p/342p이므로 대충 16%가 텍스트. 목차도 텍스트고 각 화마다 나오는 정리가 4p로 고정은 아니므로 오차는 꽤 크겠네요(웃음). 아무튼, 그림체도 정겹고 내용과 아주 잘 어울려서 글을 읽는데 더욱 몰입감을 줍니다.

1화. 상관관계와 인과관계

 

대략 목차는 아래와 같습니다. 괄호 안에 부제목을 보면 확 끌리실 겁니다.

  • 1화 상관관계와 인과관계 (광고 덕분에 DAU가 늘었다?)
  • 2화 숫자의 불확실성 (큰 수를 더 크다고 말하지 못하고)
  • 3화 모수와 표본 (모수가 이렇게 충분한데 그냥 쓰면 안 될까?)
  • 4화 확률과 분호 (그때는 맞고 지금은 틀린가?)
  • 5화 실험을 통한 의사 결정 (실험의, 실험에 의한, 실험을 위한)
  • 6화 그래프 읽기 (백문이 불여일견이라는 거짓말)
  • 7화 추세선 그리기 (엑셀이 이르시되 추세선이 있으라)
  • 8화 시계열 데이터 (나는 내일, 어제의 데이터와 만난다)
  • 9화 별점의 함정 (나의 3점과 당신의 3점은 다르다)
  • 10화 인구통계학 정보의 효용성 (이 광고는 30대의 여성을 대상으로 타기팅했습니다?)
  • 11화 조건부 확률 (그 식당이 맛집일 확률을 찾아서)
  • 12화 범위 제한을 통한 정확도 향상 (늘 옳은 말만 하는 법)
  • 13화 평균이란 무엇인가 (평균 연봉의 함정)
  • 14화 데이터 문해력 (데이터로 읽기 쓰기)

제목만 봐도 대충 어떤 내용인지 감이 오실 텐데요. 몇 개 살펴보면 "6화에 그래프 읽기"는 요즘 아주 뜨거운 주제입니다. 간혹 언론에서도 실수처럼 그래프를 교묘하게 해석되도록 배포하는 경우가 있죠. A와 B의 데이터를 꺾은선 그래프로 보여주면서 실제 y축 숫자 데이터의 차이는 아주 크게 벌어져있지만 그래프의 생김새는 교묘하게 비슷한 것처럼 보이는걸 한 번쯤은 보신 적 있을 겁니다. 또 "13화 평균이란 무엇인가"도 재밌는 주제입니다. 기업 정보에 평균 연봉을 높게 기재하면서 마치 입사하게 되면 고연봉자가 될 것처럼 꾸며진 경우가 있습니다. 그런데 실상 데이터를 살펴보면 임원 연봉이 평균을 오염시키는 경우지요. 이렇듯 대부분 우리 주변에서 쉽게 만날 수 있는 소재들로 구성되어 있어서 더욱 몰입해서 읽을 수 있습니다.

이 책은 yes24에서 1화를 무료로 볼 수 있습니다. 저도 가벼운 마음으로 1화를 훑어보고 바로 구매를 결심하게 됐습니다. 비교적 가벼운 내용을 다루고 있지만, 얻게 되는 인사이트는 강력하거든요. 요즘처럼 "데이터 기반 의사결정"이 유행/필수처럼 번지고 있는 시점에 많은 사람들이 데이터를 올바르게 해석할 수 있도록 읽었으면 좋겠습니다. 데이터 분석가뿐만 아니라 그 직군을 준비하는 사람, 혹은 회사에서 데이터 분석가와 업무를 하게 될 사람. 나아가 데이터를 한 번이라도 들여다볼 일이 있는 사람이라면 일독을 권합니다.

 

댓글
최근에 올라온 글
최근에 달린 댓글
글 보관함
Total
Today
Yesterday