제어문 데이터 분석을 하다 보면 특정 조건에 부합한 경우에만 코드를 수행하거나, 조건에 따라 반복 연산이 필요한 경우가 생긴다. 이렇게 조건에 따라 코드의 실행을 통제하기 위해 사용하는 기능을 제어문이라고 하며, 대표적으로 if 문, for 문, while 문 등이 있다. 1) if 문 if 문은 특정 상황이 생겼을 때 조건을 판단하여 이에 맞는 작업을 수행하기 위해 사용된다. if 문의 기본구조는 아래와 같다. if 조건문의 조건을 확인하고 조건을 만족하면 ‘수행할 코드 A’를 실행하고, 그렇지 않다면 else문 다음에 기재된 ‘수행할 코드 B’를 실행한다. point = 20 if point >= 60: print('vip') else: print('member') 조건문을 효율적으로 만들기 위해서는 적절한.. 자료형 데이터 파이썬의 자료형 데이터 다른 프로그래밍 언어와 마찬가지로 파이썬 역시 다양한 데이터의 형태를 활용하여 작업할 수 있다. 파이썬에서 주로 다루는 자료형에 대해 알아보고 간략한 실습을 통해 익숙해지도록 하자. 1) 파이썬 자료형의 종류 파이썬을 포함한 컴퓨터 프로그래밍 언어가 직접 다루는 데이터의 형태를 자료형이라 하며, 파이썬에서 사용되는 자료형에는 숫자형과 문자형, 그리고 여러 개의 데이터를 묶어 순차적으로 저장하는 집합적 자료형로서 리스트 (List), 튜플 (Tuple), 키 (Key)와 값 (Value)으로 이루어진 딕셔너리 (Dictionary) 등이 있다. 각 자료형의 의미와 예시는 다음과 같다. [표 2-1] 파이썬 자료형 자료형 특징 숫자형 숫자 형태로 구성된 자료형 정수, 실수를 주로 사용.. Anaconda 실습 환경 구축 Anaconda 실습 환경 구축 내가 주로 사용하는 파이썬 실습환경은 윈도우용 아나콘다 파이썬 (Anaconda Python)과 주피터 노트북 (Jupyter Notebook)이다. 아나콘다 파이썬은 파이썬 프로그램이 실행되기 위한 일종의 엔진으로서 기존 파이썬에서 배포하는 기본적인 라이브러리들뿐만 아니라 Pandas, Numpy, Scipy, Scikit-Learn 등 통계분석과 머신러닝에서 사용하는 각종 수학/과학 라이브러리들을 패키징하여 배포하기 때문에 사용자 입장에서 매우 편리하다. 주피터 노트북은 파이썬뿐만 아니라 다양한 프로그래밍 언어를 편집할 수 있고, 즉각적인 실행 결과를 파악하기 편리한 인터페이스를 제공하는 강력한 편집도구이다. 1) 아나콘다 파이썬 설치 아나콘다 파이썬을 설치하기 위해서.. 소개 파이썬은 1991년, 프로그래머인 귀도 반 로섬 (Guido van Rossum)이 발표한 고급 프로그래밍 언어로서 컴파일 과정 없이 명령을 내리면 바로 동작하는 인터프리티드 언어(스크립트 언어)이다. 파이썬이란 이름은 귀도 반 로섬이 좋아하는 코미디 ‘Monty Python’s Flying Circus’에서 따온 것이라고 알려져 있다. 파이썬은 비영리재단인 파이썬 소프트웨어 그룹에서 관리하는 개방형, 공동체 기반 개발 언어로서 처음 발표된 이후에도 지속해서 새로운 버전으로 개선되고 있다. 파이썬 외에도 R이나 SAS와 같은 빅 데이터 분석 언어들이 많이 존재하지만, 내가 생각하는 파이썬의 장점은 아래와 같다. 1. 무료이고, 사용하기 어렵지 않다. 파이썬은 R과 마찬가지로 누구나 무료로 다운로드하여 사.. independent sample t-test independent sample t-test independent sample t-test는 두 개의 독립된 그룹간의 특정 값의 평균을 비교하기 위해 사용하는 검정 방법이다. 만약 프랜차이즈 화장품 매장을 운영한다고 했을 때 강남지점과 명동지점의 평균 객단가는 동일하다고 볼 수 있을까? 두 지점의 평균 객단가가 유의미한 차이를 보이고 있다면 각 지점에 대한 전략이 달라져야 할 것이다. 이 뿐만 아니라 유지고객과 이탈고객간의 구매빈도차이, 성별 구매금액 차이 등을 검토 할 수 있도록 지원하는 분석 기법이다. independent sample t-test 값 산출방식 독립된 두 표본의 분산이 같을 경우와 분산이 다를 경우로 구분할 수 있다. 하지만 사실상 두 표본의 표준편차의 차이 값을 산출하는 공식만 다.. t-test (one sample t-test) 평균 비교 분석 평균을 비교하는 분석 기법은 t-test, z-test, ANOVA 등이 있다. t-test과 z-test은 2개 이하의 집단에서 평균을 비교하는 거의 동일한 분석 기법으로 모집단의 분산을 알고 있고, 표본의 수가 많을 때 t-test 대신 z-test을 사용할 수 있다. 그러나 실제로는 대부분의 분석 상황에서 모집단의 분산을 알기가 어렵기 때문에 t-검정을 주로 사용한다. 평균 비교 분석 간 차이 t-test z-test ANOVA 집단의 수 2개 이하 2개 이하 3개 이상 모집단의 분산 알 수 없음 알고 있음 알 수 없음 표본의 수 상관 없음 30개 이상 상관없음 등분산성 고려함 고려 하지 않음 고려함 t-test 두 개 이하의 집단에서 수치형 변수의 평균의 일치성을 판단하는 기법 t.. 이전 1 다음