티스토리 뷰

빅데이터가 유행하고 뒤이어 머신러닝, 딥러닝의 시대가 오면서 데이터 분석 분야가 핫해지고 있다. 그에따라 데이터 분석가, 데이터 엔지니어의 수요가 많아지고 있는데, 한빛미디어에서 그 직업군의 길라잡이가 되어주는 책이 나왔다. 


Foundations for Analytics with Python

파이썬 데이터 분석 입문


페이스북 데이터 과학자로 근무했던 Clinton Brownley 의 책이 원서이고 한창진/이병욱 님이 번역을 하셨다. 번역서지만 훌훌 읽는데 무리가 없다.


구성

이 책은 파이썬이라는 프로그래밍 언어를 기본으로 데이터 분석을 다룬다. 우선 프로그래밍 기초가 없는 독자를 대상으로 했기 때문에 1장에 "파이썬 기초" 를 시작으로 하고, 2장에서는 CSV 파일을 다루는 기법을 소개한다.  3장은 엑셀 파일을 다루는 여러가지 방법을 소개하고, 4장은 파이썬 내장 모듈인 sqlite3MySQL 같은 데이터베이스를 통한 데이터 분석을 다룬다. 5장은 앞선 내용에 대한 응용작업을 기술한다. 


이후 6장에서는 데이터 분석의 꽃인 "데이터 시각화"를 다루는데 matplotlib 을 시작으로 팬더스, ggplot, seaborn 을 사용한다. 7장은 공개 되어 있는 데이터셋을 기반으로 기술통계와 모델링을 다룬다. 8장은 스크립트 자동 실행 예약을 다루는데 윈도우의 작업 스케줄러와 *NIX 에서의 crontab 을 소개한다. 끝으로 9장은 더 공부할 것들에 대해 몇 가지 언급하고 책은 마무리 된다.


아쉬움

입문 서적인 것을 생각했을 때 모든 코드에 대한 실행 결과가 함께 첨부되지 못한점이 크게 아쉽게 다가온다. 모든 독자가 컴퓨터 앞에서 예제를 타이핑할 수 없다는 점을 감안하지 못한 듯 하다. 또한 자세한 설명이 누락된 느낌이다. 친절하지 못하다는 표현이 맞을까? (예를들어) 특히 6장 "데이터 시각화" 는 배경 지식이 있는 상태로 읽어도 쉽지가 않다. 


이런점은 좋다

앞선 구성에서 알 수 있듯이 정말 많은 것을 두루 다루고 있다. 비록 친절하지는 않지만 다양한 지식을 얻을 수 있다. 사실 "그런게 있다"만 알아도 나중에 검색이나 심도있는 과정을 통해 자세히 확인할 수 있으니까 말이다. 어느 분야든지 입문할 때 폭넓은 배경지식이 필요하다는 점을 감안하면 이 책이 바로 그런 부분을 충족시켜 주는 책이다. 



마무리

유행에 크게 민감하게 반응할 필요는 없지만 데이터 분석은 이미 많은 분야에 필수가 되었다. 꼭 데이터 분석이나 데이터 엔지니어가 아니더라도 사회는 기타 업종의 개발자나 엔지니어에게 데이터 분석에 대한 최소한의 역량을 요구한다 (기획자나 마케터에게도 그런 역량을 요구하는 세상). 그렇기 때문에 최소한의 노력으로 화려한 결과를 도출하고 싶다면 데이터 분석이라고 하는 분야에 살짝 발을 딛는 것도 나쁘지 않겠다. 이 책이 그 시작을 도와줄 것이다.



댓글
댓글쓰기 폼