본문 바로가기

빅데이터 분석 첫걸음 (w.패캠)

[패스트캠퍼스] 파이썬 - numpy/pandas 라이브러리 (3주차 데이터 분석 인강)

반응형

아니 벌써 3주차라니~

난 아직 열심히 복습도 못한 것 같은데! 

이력서쓰랴, 자소서쓰랴,, (놀으랴,,) 수업 듣는게 생각보다 빡세다!!!

그치만 꼼꼼히 들으려고 노력하면서 들으니, 이해도 잘 되고 뿌듯한 것 사실이다!!

 

이번 주는 numpy와 pandas에 대해서 공부를 하였다. 

pandas는 데이터 분석에서 가장 많이 사용되던 라이브러리였는데, 

제대로 공부해본 적은 없고 실무에만 던져져서 사용해본 경험만 있었다. 

그래서 이번 기회에 제대로 공부하고 싶었는데, 

벌써 pandas 수업을 하다니~ 

 

아무튼 첫 번째 수업은 numpy였다. 

 

Numpy

 

012345678
numpy 필기 자료

 

numpy는 수치 연산용 라이브러리로, C++기반으로 작성되었지만,

python이 기본적으로 가지고 있는 연산 기능에 비해 월등히 좋다고 하셨다. 

실제로도, python은 간혹 잘못된 연산으로 인해 이슈를 발생시키는데, 

numpy는 이를 보완하고자 만들어졌다고 한다. 

 

numpy에 있는 함수들은 이전에 많이 봐왔지만, 외운 것만 외웠고

봐야지만 알 수 있는 함수들이 많았다. 

그러나 선생님께서도 몇몇의 함수를 제외하고는 굳이 외우지 않아도 된다고 하셨다.

필요할때마다 구글링해서 찾아보면 바로 나오는 것! 

내 머리에도 한계가 있으니깐, 정말 필요한 것만 외우는 걸로! 

그리고 자주 쓰다 보면 자연스럽게 기억하게 되는 것도 있으니, 

억지로 외우려 노력하지 않으려 한다! 

그러면 더더욱 하기 싫어짐,,ㅠ

 

Pandas

 

다음으로 드디어 pandas 라이브러리에 대해 공부하였다!

 

012345
pandas 필기 노트

 

사실 series 형태가 있다는 것 조차 까먹고 있었다. 

DataFrame의 형태를 이루고 있는 것이 Series 형태였다는 것만 알았어도 엄청난 소득이다.

게다가, indexing을 자유자재로 하고, slicing 하는 방법에 대해 복습할 수 있어서 너무 좋았다. 

특히, df.loc[] 와 df.iloc[] 함수의 기능을 통해 특정 위치/값으로 slicing을 할 수 있게 되어 뿌듯하다. 

 

점점 수업의 내용이 복잡해지고 있지만, 

예전에 해봤던 내용들 기반이어서 이해는 쉽게 되면서도 새로운 것을 알아가는 재미도 쏠쏠하다! 

이번 3주차도 호다닥 들어버렸지만, 

복습하면서 함수 사용법에 익숙해지도록 해야겠다. 

 

그럼 다음 4주차에도 화이팅~!~!~!

반응형