Pandas 판다스 (Pandas) 역시 NumPy와 더불어 데이터 분석과 처리를 쉽게 해줄 수 있는 라이브러리이다. Pandas는 NumPy를 기반으로 만들어졌으나, NumPy와 달리 데이터프레임 (DataFrame) 형식의 자료구조 분석에 더욱 특화되어 있으며 이외의 다양한 데이터 타입이 섞여 있을 때도 처리가 가능하다는 장점을 가지고 있다. 1) Pandas의 자료구조 간단히 Pandas를 사용해보기 위해 pd라는 별칭으로 라이브러리를 불러오자. Pandas에서 다루는 자료구조에는 크게 1차원 자료구조인 Series와 2차원 자료구조인 DataFrame이 있다. 우선 NumPy의 배열과 유사한 의미인 Series 자료구조에 대해 알아보자. Series Series 형식의 데이터는 1차원 배열에 인덱스를 붙여놓은.. Numpy 간단한 분석과 데이터 처리를 위해 가장 많이 사용하는 NumPy 라이브러리에 대해 간략히 살펴보도록 하자. NumPy는 파이썬에서 데이터 연산을 쉽고 빠르게 할 수 있도록 다차원 배열 데이터를 효과적으로 처리할 수 있는 라이브러리로서 기존의 파이썬 내장 함수를 이용하는 것보다 훨씬 효과적으로 데이터 연산을 처리할 수 있도록 지원한다. 아나콘다 파이썬에는 NumPy 라이브러리가 포함되어 있으므로 별도의 설치 없이 사용할 수 있다. NumPy에서는 주로 데이터를 배열 (Array) 단위로 관리하는데, 배열은 순서가 있는 데이터가 저장된 구조를 의미하며, 일차원 배열부터 우리가 흔히 아는 이차원 배열인 행렬 (Matrix) 또는 그 이상의 다차원 배열을 만들 수 있다. NumPy의 가장 큰 장점은 배열 간의 .. Library for Statistics Analysis (2) 1) 파이썬 라이브러리 설치하기 파이썬에서 여러 라이브러리를 불러오기 위해서는 라이브러리를 설치하는 작업이 선행되어야 한다. 라이브러리를 설치하기 위한 프로그램인 pip 파이썬 관리자에 대해 알아보고, 이를 이용해 라이브러리를 설치해보자. pip 패키지 관리자 pip (Package Install for Python)는 파이썬으로 작성된 라이브러리(패키지)를 관리하는 프로그램으로서, 파이썬 3.4 버전부터는 pip를 기본으로 제공한다. ‘Python이 저장된 경로\Python\Scripts’를 확인해보면 ‘pip.exe’, ‘pip3.exe’ 등이 저장되어 있다. 이 pip를 이용해 파이썬 라이브러리를 설치할 수 있다. pip로 설치할 수 있는 라이브러리에 대한 정보는 다음 URL에서 확인할 수 있다. .. Library for Statistics Analysis (1) 파이썬을 이용하여 데이터 분석을 할 때는 주로 라이브러리를 활용한다. 파이썬 라이브러리를 이용하면 분석 시 매번 코드를 작성해야 하는 번거로움을 덜 수 있으며, 초보자도 사용법만 익히면 쉽게 분석작업을 할 수 있다. 1) 라이브러리의 개념 파이썬에서 라이브러리 (Library)는 여러 모듈 (Module)을 체계적으로 모아 저장해 놓은 코드 묶음을 의미하며, 패키지 (Package)라고 부르기도 한다. 여기서 모듈은 파이썬 코드가 작성된 ‘.py’ 파일을 말한다. 파이선 코드를 작성한 후 파일로 저장하면 다른 코드에서도 이 파일을 불러오기 (Import)하여 해당 모듈의 변수, 함수, 클래스를 이용할 수 있다. 파이썬 라이브러리는 폴더 (Directory)구조로 되어 있어 파이썬 모듈을 계층적으로 관리할.. 제어문 데이터 분석을 하다 보면 특정 조건에 부합한 경우에만 코드를 수행하거나, 조건에 따라 반복 연산이 필요한 경우가 생긴다. 이렇게 조건에 따라 코드의 실행을 통제하기 위해 사용하는 기능을 제어문이라고 하며, 대표적으로 if 문, for 문, while 문 등이 있다. 1) if 문 if 문은 특정 상황이 생겼을 때 조건을 판단하여 이에 맞는 작업을 수행하기 위해 사용된다. if 문의 기본구조는 아래와 같다. if 조건문의 조건을 확인하고 조건을 만족하면 ‘수행할 코드 A’를 실행하고, 그렇지 않다면 else문 다음에 기재된 ‘수행할 코드 B’를 실행한다. point = 20 if point >= 60: print('vip') else: print('member') 조건문을 효율적으로 만들기 위해서는 적절한.. 자료형 데이터 파이썬의 자료형 데이터 다른 프로그래밍 언어와 마찬가지로 파이썬 역시 다양한 데이터의 형태를 활용하여 작업할 수 있다. 파이썬에서 주로 다루는 자료형에 대해 알아보고 간략한 실습을 통해 익숙해지도록 하자. 1) 파이썬 자료형의 종류 파이썬을 포함한 컴퓨터 프로그래밍 언어가 직접 다루는 데이터의 형태를 자료형이라 하며, 파이썬에서 사용되는 자료형에는 숫자형과 문자형, 그리고 여러 개의 데이터를 묶어 순차적으로 저장하는 집합적 자료형로서 리스트 (List), 튜플 (Tuple), 키 (Key)와 값 (Value)으로 이루어진 딕셔너리 (Dictionary) 등이 있다. 각 자료형의 의미와 예시는 다음과 같다. [표 2-1] 파이썬 자료형 자료형 특징 숫자형 숫자 형태로 구성된 자료형 정수, 실수를 주로 사용.. 이전 1 2 다음