본문 바로가기
book

어쩌다 데이터 분석 with 파이썬

by 믹스 2022. 10. 29.
반응형

#2240

데이터 분석에 관심 있는 입문자와 기초를 다지고 싶은 이라면 어쩌다 데이터 분석 with 파이썬을 (어렵겠지만) 읽어보길 권하고 싶다. 기본적으로 앞장은 파이썬을 사용하는데 필요한 기본 문법 등을 다루고 있으며 공부를 계속 이어나갈수록 실질적인 데이터를 다루기 위한 각종 지식을 접하게끔 구성되어있다.(따라서 상당히 지루하게 느껴진다. 이게 어디에 쓰이는지도 모르는 개념들을 접하게 되니 자연스럽게 생기는 현상이긴 하지만..)

# 어쩌다 데이터 분석 with 파이썬: 판다스로 시작하는 효율적인 데이터 분석 및 시각화

기본을 다루는 책이다 보니 정말 기본에 충실하다는 인상을 받게 되었다. 데이터에 관해 문외한이라면 좋은 책이지만 인내력을 요하는 책이라는 생각이 들었다. 이미 관련 업종에서 일하는 종사자들에게는 새로울 것이 없을 수도 있지만, 이제 발을 들여놓는 사람이라면, 정말 관심이 없다면 이 책은 큰 효용성을 발휘하지 못할 것이라 생각되었다. 책에서 언급되어 있듯 초중급자를 대상으로 하고 있는데 지극히 개인적인 견해지만, 책의 내용이 인내심을 필요로 하기 때문에 입문/초급에게는 좋지만 어려울 것 같기도 하다. 초급과 초중급의 차이가 이렇게 심한 것일까?

어쩌다 데이터 분석 with 파이썬은 데이터를 어떻게 다루어야 하는지 자세하고 친절하게 다루고 있다. 흔히 눈으로, 일반적으로 접하게 되는 데이터를 가시적으로 만들어내는 그래프 하나가 만들어지기 까지의 사전단계를 백분위수 구하기, 데이터 수 파악하기, 최소/최댓값, 평균값 등을 구하는 방법들을 하나하나 예를 들어주고 있어 보기 좋았다. 데이터 분석이란 정말 엉덩이가 무거운 사람에게 딱 어울리는 분야가 아닐까 생각되었다.

1장에서 파이썬에 대한 기본적인 것들을, 2장의 분석에 관한 기본적인 것들을 겨우 넘기고 나오는 3장에서 드디어 데이터를 정제하는 방법과 응용법을 알게 되고 4장, 5장, 6장의 데이터의 병합, 재형성, 집계, 연산, 날짜, 시간 등을 다루는 지난한 과정을 거쳐 7장에 가서야 우리가 일반적으로 접하게 되는 시각화에 대해 다루게 된다. 어렵지만, 하나하나 개념을 익혀 나가는 과정이 나름 재미있기도 하다.

초반, 몇 번인가 파이썬을 건드려 보고 아주 기초적이나마 문법이 눈에 익었다는 생각에 설렁거리면 읽어나가다 통계를 다루기 위해 사용되는 분석에 관한 기본적인 것을 다루는 2장부터 3장까지 예제를 따라 하면서 나아가는데 갈수록 안갯속을 헤매는 느낌이었다. 제대로 준비가 되어 있지 않다는 것을 느끼고 다시 앞으로 돌아가 읽어 나가기 시작했다.

예제를 따라 하기 위한 환경으로 기본적으로는 아나콘다를 제안하고 있지만, 대안으로 제시하고 있는 구글 코랩을 통해서도 따라 하는데 지장은 없었다. 새로 무언가를 깔기가 껄끄럽다면 대안으로 좋을 것 같다.

 

Google Colaboratory

 

colab.research.google.com

# 후기

어쩌다 데이터 분석 with 파이썬은 읽기 편하게 정리되어 있는 첫인상을 받는다. 그리고 별로 어려울 것 같지 않다는 착각도 들게 만든다. 하지만, 책을 읽다 보면 인내력을 필요로 하게 된다는 것을 알게 된다. 왜냐고? 그림이 많은 것 같아 쉽다는 생각이 들지만, 결국 테이블로 이루어진 데이터들을 다루고 정제하는 과정을 보여주기 때문이다. 그럼, 재미가 없을까 싶으면 또 그렇지 않은 게... 필터링되어 있지 않은 데이터를 하나하나 만들어 나가는 과정이 나름 흥미롭다.

결국 목적의식이 확실한 초보자라면 책을 따라 하면서 데이터에 대한 깊이 있는 공부가 가능할 것 같다. 지은이의 말에 책의 집필 과정과 어려웠던 과정을 같은 과정을 진행하고 있는 이들에게 전달해주기 위해 작성된 만큼 쉽게 익힐 수 있다는 문구로 현혹하는 것이 아닌 실제로 필요한 것들을 알려주고 그 과정이 쉽지 않다는 것을 알려주는 책이라 생각되었다. 눈에 보이는 산출물을 만들기 위해 어떤 치밀한 과정이 필요한지 어쩌다 데이터 분석 with 파이썬을 통해 경험할 수 있을 것이다.


반응형

댓글0