본문 바로가기
Data Preprocessing

데이터 불러오기

by Nowkeeh Ahc

 

 

데이터 불러오기 (CSV, Excel, JSON 등)

데이터 분석을 위해서는 먼저 데이터를 불러와야 합니다. 파이썬에서는 CSV, Excel, JSON 등 다양한 형식의 데이터를 불러올 수 있습니다. 이번 게시글에서는 각 형식의 데이터를 불러오는 방법에 대해서 살펴보겠습니다.

CSV 데이터 불러오기

CSV(Comma-Separated Values) 파일은 각 열을 쉼표(,)로 구분한 텍스트 파일입니다. 파이썬에서 CSV 파일을 불러오기 위해서는 csv 모듈을 사용합니다. 예를 들어, 다음과 같은 CSV 파일이 있다고 가정해보겠습니다.

Name Age City
John 25 New York
Jane 30 Los Angeles
Mike 35 Chicago

위의 CSV 파일을 불러오기 위해서는 다음과 같은 코드를 사용합니다.

import csv with open('data.csv', newline='') as f: reader = csv.reader(f) for row in reader: print(row)

위의 코드에서, csv.reader() 함수를 사용하여 CSV 파일을 읽어오고, for 문을 사용하여 한 줄씩 읽어옵니다. 각 줄은 리스트 형태로 저장됩니다.

Excel 데이터 불러오기

Excel 파일은 Microsoft Office의 스프레드시트 프로그램에서 생성되는 파일입니다. 파이썬에서 Excel 파일을 불러오기 위해서는 pandas 라이브러리를 사용합니다. 예를 들어, 다음과 같은 Excel 파일이 있다고 가정해보겠습니다.

Name Age City
John 25 New York
Jane 30 Los Angeles
Mike 35 Chicago

위의 Excel 파일을 불러오기 위해서는 다음과 같은 코드를 사용합니다.

import pandas as pd data = pd.read_excel('data.xlsx') print(data)

위의 코드에서, pd.read_excel() 함수를 사용하여 Excel 파일을 읽어오고, print() 함수를 사용하여 데이터를 출력합니다. 또한, Excel 파일 내의 특정 시트를 불러올 경우에는 다음과 같은 코드를 사용합니다.

data = pd.read_excel('data.xlsx', sheet_name='Sheet1')

JSON 데이터 불러오기

JSON(JavaScript Object Notation)은 자바스크립트에서 사용하는 데이터 교환 형식입니다. 파이썬에서 JSON 파일을 불러오기 위해서는 json 모듈을 사용합니다. 예를 들어, 다음과 같은 JSON 파일이 있다고 가정해보겠습니다.

{ "name": "John", "age": 25, "city": "New York" }

위의 JSON 파일을 불러오기 위해서는 다음과 같은 코드를 사용합니다.

import json with open('data.json') as f: data = json.load(f) print(data)

위의 JSON 파일을 불러오기 위해서는 다음과 같은 코드를 사용합니다.

import json with open('data.json') as f: data = json.load(f) print(data)

위의 코드에서, json.load() 함수를 사용하여 JSON 파일을 읽어옵니다. JSON 파일 내의 데이터는 딕셔너리 형태로 저장됩니다.

기타 데이터 형식 불러오기

파이썬에서는 CSV, Excel, JSON 이외에도 다양한 형식의 데이터를 불러올 수 있습니다. 예를 들어, 다음과 같은 형식의 데이터를 불러올 수 있습니다.

  • HTML 파일: pandas의 read_html 함수를 사용하여 불러올 수 있습니다.
  • XML 파일: xml.etree.ElementTree 모듈을 사용하여 불러올 수 있습니다.
  • 데이터베이스: 파이썬의 sqlite3 모듈을 사용하여 SQLite 데이터베이스를 불러올 수 있습니다.
  • 웹 API: requests 모듈을 사용하여 웹 API에서 데이터를 불러올 수 있습니다.

각 데이터 형식의 불러오기 방법에 대해서는 추후에 다른 게시글에서 자세히 다루도록 하겠습니다.

댓글